Новости — 1 сентября 2021, 11:25

Появилась нейросеть, которая реалистично воссоздает человеческий голос

Разработчики из Nvidia считают так: искусственный интеллект уже неплохо копирует речь людей, но отличить голос живого человека от робота все еще очень просто. Вся проблема в том, что люди говорят со сложным ритмом, интонациями, каждый со своей скоростью и тембром. Эти детали нейросетям сложно воспроизвести. Точнее, было сложно до последнего времени. В Nvidia попытались сократить этот разрыв и, кажется, у них получилось. На конференции Interspeech 2021 компания представила свои новые технологии, которые позволяют «тренировать» ИИ собственным голосом и получать максимально приближенный к реальности результат. 

Главная из них — RAD-TTS (она даже одержала победу на каком-то конкурсе). В основе этой технологии лежит идея восприятия человеческого голоса как музыкального произведения. Поэтому интерфейс RAD-TTS позволяет определять тональность, длительность и силу говорящего с максимальной точностью. Один из главных навыков этой технологии — произносить речь одного человека голосом другого. В ролике, опубликованном на ютьюб-канале Nvidia, видно, как мужчина зачитывает текст, а нейросеть, сохраняя его интонации и ритм, преобразует голос в женский. Впоследствии с RAD-TTS можно работать как с актером озвучки: попросить выделить определенные слова, изменить темп и много чего еще. 

#INSERT_ARTICLE#

Для демонстрации собственных успехов Nvidia опубликовала серию роликов I Am AI («Я — искусственный интеллект»). Там демонстрируются многие технологии компании, но диктором зачастую выступает нейросеть. Сказать, что искусственно сгенерированный голос не отличить от человеческого, нельзя — это будет ложью. Но, возможно, это самый приближенный вариант из тех, что пока можно услышать. В перспективе подобные технологии могут использоваться не только для озвучивания, но и для воссоздания выступлений легендарных певцов, синхронного перевода, а также для помощи людям с нарушениями голоса.

Среди других относительно свежих разработок Nvidia — SDK Maxine и Canvas. Первая может создавать реалистичные аватары для видеоконференций. Для работы SDK Maxine нужна обычная фотография на вебку. На нее нейросеть наложит артикуляцию и сгенерирует анимированную картинку. А Canvas — это «умная» версия допотопного Paint. При помощи специальных инструментов там можно рисовать схематичные разноцветные картинки, а ИИ создаст из них реалистичные пейзажи. Причем результат преображения виден сразу, и выглядит это магически. 

Подписывайтесь на наш Telegram-канал
Фото: кадр из фильма «Окей, Лекси!»
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Кино — 18:15, 6 марта 2026
Ограниченная палитра. Разбираемся, зачем делать фильмы черно-белыми
Новости, Новости — 6 марта, 18:15
Вышел трейлер финального сезона «Пацанов»
Новости, Новости — 6 марта, 16:45
Энн Хэтуэй выпустила трек для фильма студии A24 совместно с Charli XCX
Новости, Новости — 6 марта, 15:15
Питер Джексон получит почетную «Золотую пальмовую ветвь» на Каннском кинофестивале
Новости, Новости — 6 марта, 13:10
Brick Labs выпустили конструкторы по «Смешарикам»
Новости, Новости — 6 марта, 12:00
Завершились съемки пятого сезона сериала «Папины дочки. Новые»
Новости, Новости — 6 марта, 10:43
Ринго Старр из The Beatles анонсировал кантри-альбом Long Long Road
Новости, Новости — 6 марта, 09:16
Рената Литвинова приняла участие в показе Matières Fécales в Париже
Новости, Новости — 5 марта, 23:55
Запустился подкаст, исследующий вклад женщин в историю городов
Новости, Новости — 5 марта, 15:40
Сериал «Медведь» закончится на пятом сезоне
Новости, Новости — 5 марта, 14:55
Вышел трейлер концертного фильма BTS на Netflix
Новости, Новости — 5 марта, 13:00
Появились трейлер и постер фильма «Не одна дома 3. Выпускной»
Кино — 5 марта, 12:52
«One Piece. Большой куш», «Острые козырьки: Бессмертный», «У меня очень плохое предчувствие» и еще 3 проекта Netflix, которые надо ловить в марте
Новости, Новости — 5 марта, 11:10
Елизавета Базыкина, Ася Лавринович и Ида Галич: «Форум в большом городе» объявил полную программу
Новости, Новости — 4 марта, 21:00
ZOLOTO выпускает концертный фильм «Перевоплотиться»
Новости, Новости — 4 марта, 19:15
Появился треклист нового альбома BTS Arirang
Новости, Новости — 4 марта, 18:33
Московская неделя моды пройдет с 14 по 19 марта
Бизнес — 4 марта, 15:45
Сцепка с корнями. Интервью с соосновательницей бренда ARNY PRAHT Анной Прахт
Новости, Новости — 4 марта, 14:40
Мейси Стелла и Татум Грейс Хопкинс исполнят главные роли в экранизации Life Is Strange
Новости, Новости — 4 марта, 13:15
Warner Bros. запускает фильм по «Игре престолов» об Эйгоне I Таргариене
Новости, Новости — 4 марта, 12:00
В Москве пройдет фестиваль научного кино «ФАНК»
Новости, Новости — 4 марта, 10:54
IOWA, «Сова» и Loqiemean: фестиваль «Стереолето» объявил вторую волну артистов
Все звёзды и инфлюенсеры
Новости, Новости — 4 марта, 09:45
Марлон Уайанс намерен вернуть дерзость франшизе «Очень страшное кино»
Новости, Новости — 3 марта, 18:10
Apple представила бюджетный iPhone 17e
Новости, Новости — 3 марта, 17:15
Стриминги HBO Max и Paramount+ объединят в одну платформу
Новости, Новости — 3 марта, 16:05
Евгений Стычкин снял сериал «Хоспис» о врачебной гордости и принятии смерти
Новости, Новости — 3 марта, 14:35
Obgon выпустил альбом Fast Track. Релиз вдохновлен московскими автомагистралями
Новости, Новости — 3 марта, 12:35
«Сират» стал одним из лидеров национальной кинопремии Испании «Гойя»
Новости, Новости — 3 марта, 10:40
SLAVA MARLOW, «ЛАУД» и Хаски: фестиваль New Star Camp объявил программу
Новости, Новости — 3 марта, 09:00
Стартовали съемки третьего сезона сериала «Телохранители»
Новости, Новости — 2 марта, 20:05
Подписи к гифкам и стикеры из фото: Telegram выпустил обновление