Новости — 1 сентября 2021, 11:25

Появилась нейросеть, которая реалистично воссоздает человеческий голос

Разработчики из Nvidia считают так: искусственный интеллект уже неплохо копирует речь людей, но отличить голос живого человека от робота все еще очень просто. Вся проблема в том, что люди говорят со сложным ритмом, интонациями, каждый со своей скоростью и тембром. Эти детали нейросетям сложно воспроизвести. Точнее, было сложно до последнего времени. В Nvidia попытались сократить этот разрыв и, кажется, у них получилось. На конференции Interspeech 2021 компания представила свои новые технологии, которые позволяют «тренировать» ИИ собственным голосом и получать максимально приближенный к реальности результат. 

Главная из них — RAD-TTS (она даже одержала победу на каком-то конкурсе). В основе этой технологии лежит идея восприятия человеческого голоса как музыкального произведения. Поэтому интерфейс RAD-TTS позволяет определять тональность, длительность и силу говорящего с максимальной точностью. Один из главных навыков этой технологии — произносить речь одного человека голосом другого. В ролике, опубликованном на ютьюб-канале Nvidia, видно, как мужчина зачитывает текст, а нейросеть, сохраняя его интонации и ритм, преобразует голос в женский. Впоследствии с RAD-TTS можно работать как с актером озвучки: попросить выделить определенные слова, изменить темп и много чего еще. 

#INSERT_ARTICLE#

Для демонстрации собственных успехов Nvidia опубликовала серию роликов I Am AI («Я — искусственный интеллект»). Там демонстрируются многие технологии компании, но диктором зачастую выступает нейросеть. Сказать, что искусственно сгенерированный голос не отличить от человеческого, нельзя — это будет ложью. Но, возможно, это самый приближенный вариант из тех, что пока можно услышать. В перспективе подобные технологии могут использоваться не только для озвучивания, но и для воссоздания выступлений легендарных певцов, синхронного перевода, а также для помощи людям с нарушениями голоса.

Среди других относительно свежих разработок Nvidia — SDK Maxine и Canvas. Первая может создавать реалистичные аватары для видеоконференций. Для работы SDK Maxine нужна обычная фотография на вебку. На нее нейросеть наложит артикуляцию и сгенерирует анимированную картинку. А Canvas — это «умная» версия допотопного Paint. При помощи специальных инструментов там можно рисовать схематичные разноцветные картинки, а ИИ создаст из них реалистичные пейзажи. Причем результат преображения виден сразу, и выглядит это магически. 

Подписывайтесь на наш Telegram-канал
Фото: кадр из фильма «Окей, Лекси!»
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Музыка — 21:00, 4 марта 2026
«Новая русская волна»: чем она была, а чем так и не стала?
Новости, Новости — 4 марта, 21:00
ZOLOTO выпускает концертный фильм «Перевоплотиться»
Новости, Новости — 4 марта, 19:15
Появился треклист нового альбома BTS Arirang
Новости, Новости — 4 марта, 18:33
Московская неделя моды пройдет с 14 по 19 марта
Бизнес — 4 марта, 15:45
Сцепка с корнями. Интервью с соосновательницей бренда ARNY PRAHT Анной Прахт
Новости, Новости — 4 марта, 14:40
Мейси Стелла и Татум Грейс Хопкинс исполнят главные роли в экранизации Life Is Strange
Новости, Новости — 4 марта, 13:15
Warner Bros. запускает фильм по «Игре престолов» об Эйгоне I Таргариене
Новости, Новости — 4 марта, 12:00
В Москве пройдет фестиваль научного кино «ФАНК»
Новости, Новости — 4 марта, 10:54
IOWA, «Сова» и Loqiemean: фестиваль «Стереолето» объявил вторую волну артистов
Новости, Новости — 4 марта, 09:45
Марлон Уайанс намерен вернуть дерзость франшизе «Очень страшное кино»
Кино — 3 марта, 19:50
Ограниченная палитра. Разбираемся, зачем делать фильмы черно-белыми
Новости, Новости — 3 марта, 18:10
Apple представила бюджетный iPhone 17e
Новости, Новости — 3 марта, 17:15
Стриминги HBO Max и Paramount+ объединят в одну платформу
Новости, Новости — 3 марта, 16:05
Евгений Стычкин снял сериал «Хоспис» о врачебной гордости и принятии смерти
Новости, Новости — 3 марта, 14:35
Obgon выпустил альбом Fast Track. Релиз вдохновлен московскими автомагистралями
Новости, Новости — 3 марта, 12:35
«Сират» стал одним из лидеров национальной кинопремии Испании «Гойя»
Новости, Новости — 3 марта, 10:40
SLAVA MARLOW, «ЛАУД» и Хаски: фестиваль New Star Camp объявил программу
Новости, Новости — 3 марта, 09:00
Стартовали съемки третьего сезона сериала «Телохранители»
Новости, Новости — 2 марта, 20:05
Подписи к гифкам и стикеры из фото: Telegram выпустил обновление
Новости, Новости — 2 марта, 19:50
Звезда «Во все тяжкие» появился в проекте «Miyagi & Эндшпиль»
Новости, Новости — 2 марта, 18:40
Netflix выпустит аниме «Одуванчик» по дебютной манге автора «Гинтамы»
Новости, Новости — 2 марта, 17:40
В московском боулинге «Дорожка» отметят День чувака
Все звёзды и инфлюенсеры
Новости, Новости — 2 марта, 16:50
В Лос-Анджелесе прошла премия Гильдии киноактеров США
Новости, Новости — 2 марта, 15:40
Зендея и Том Холланд тайно поженились
Новости, Новости — 2 марта, 14:30
Комиксист Виталий Терлецкий стал участником «Битвы экстрасенсов»
Новости, Новости — 1 марта, 10:34
В Японии разработали первого ИИ-робота-буддиста
Новости, Новости — 28 февраля, 22:15
После десятилетней паузы Бруно Марс вернулся с сольным альбомом
Новости, Новости — 28 февраля, 20:55
Аниме «Сказание об Аканэ» получило трейлер и дату релиза
Кино — 28 февраля, 17:33
Репутационные издержки. Почему поросенок Фунтик — лучший пример имидж-менеджмента
Образ жизни — 27 февраля, 19:38
24 часа в Казани. Куда сходить, чем заняться и где поесть
Новости, Новости — 27 февраля, 15:15
Blackpink выпустили мини-альбом DEADLINE