Новости — 1 сентября 2021, 11:25

Появилась нейросеть, которая реалистично воссоздает человеческий голос

Разработчики из Nvidia считают так: искусственный интеллект уже неплохо копирует речь людей, но отличить голос живого человека от робота все еще очень просто. Вся проблема в том, что люди говорят со сложным ритмом, интонациями, каждый со своей скоростью и тембром. Эти детали нейросетям сложно воспроизвести. Точнее, было сложно до последнего времени. В Nvidia попытались сократить этот разрыв и, кажется, у них получилось. На конференции Interspeech 2021 компания представила свои новые технологии, которые позволяют «тренировать» ИИ собственным голосом и получать максимально приближенный к реальности результат. 

Главная из них — RAD-TTS (она даже одержала победу на каком-то конкурсе). В основе этой технологии лежит идея восприятия человеческого голоса как музыкального произведения. Поэтому интерфейс RAD-TTS позволяет определять тональность, длительность и силу говорящего с максимальной точностью. Один из главных навыков этой технологии — произносить речь одного человека голосом другого. В ролике, опубликованном на ютьюб-канале Nvidia, видно, как мужчина зачитывает текст, а нейросеть, сохраняя его интонации и ритм, преобразует голос в женский. Впоследствии с RAD-TTS можно работать как с актером озвучки: попросить выделить определенные слова, изменить темп и много чего еще. 

#INSERT_ARTICLE#

Для демонстрации собственных успехов Nvidia опубликовала серию роликов I Am AI («Я — искусственный интеллект»). Там демонстрируются многие технологии компании, но диктором зачастую выступает нейросеть. Сказать, что искусственно сгенерированный голос не отличить от человеческого, нельзя — это будет ложью. Но, возможно, это самый приближенный вариант из тех, что пока можно услышать. В перспективе подобные технологии могут использоваться не только для озвучивания, но и для воссоздания выступлений легендарных певцов, синхронного перевода, а также для помощи людям с нарушениями голоса.

Среди других относительно свежих разработок Nvidia — SDK Maxine и Canvas. Первая может создавать реалистичные аватары для видеоконференций. Для работы SDK Maxine нужна обычная фотография на вебку. На нее нейросеть наложит артикуляцию и сгенерирует анимированную картинку. А Canvas — это «умная» версия допотопного Paint. При помощи специальных инструментов там можно рисовать схематичные разноцветные картинки, а ИИ создаст из них реалистичные пейзажи. Причем результат преображения виден сразу, и выглядит это магически. 

Подписывайтесь на наш Telegram-канал
Фото: кадр из фильма «Окей, Лекси!»
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Кино — 10:30, 14 апреля 2026
Между нами пальба. Рецензия на фильм «Вот это драма!»
Новости, Новости — 14 апреля, 10:30
Вышел трейлер документального фильма о Паше Технике
Новости, Новости — 14 апреля, 09:45
Начались съемки второго сезона «Мистера и миссис Смит» с Марком Эйдельштейном
Новости, Новости — 13 апреля, 16:49
The Rolling Stones готовят новый альбом
Новости, Новости — 13 апреля, 15:20
«Может, взрослей стать пора?». Mirèle и ГЛУМ записали совместный трек
Новости, Новости — 13 апреля, 14:56
TXT выпустили восьмой мини-альбом
Новости, Новости — 13 апреля, 12:41
В TikTok появился новый тренд на цифры
Новости, Новости — 12 апреля, 13:20
Бьорк проведет фестиваль во время солнечного затмения в Исландии
Новости, Новости — 11 апреля, 17:25
Зомби-хоррор «Колония» выйдет в российский прокат в конце мая
Новости, Новости — 11 апреля, 15:15
Новый роман Пелевина выйдет 23 апреля и затронет дело Эпштейна
Новости, Новости — 10 апреля, 18:21
Издательство Inspiria запускает направление «Ромэнтези»
Новости, Новости — 10 апреля, 17:37
Книжное сообщество «Смысловая 226» откроет магазин в Москве
Новости, Новости — 10 апреля, 14:20
Radiohead покажут иммерсивную инсталляцию на Coachella–2026
Новости, Новости — 10 апреля, 13:15
«Comic Con Игромир 2026» анонсировал даты проведения
Кино — 10 апреля, 13:15
Ну, посмотрим: «Полутон», «Проект "Конец света"», «Гуру», «Прыгуны», «Наследник», «Крик 7»
Новости, Новости — 10 апреля, 12:01
Каннский фестиваль объявил конкурсную программу 2026 года
Новости, Новости — 10 апреля, 11:05
Хваса представила клип на песню So Cute
Новости, Новости — 9 апреля, 19:00
Группа KATSEYE выпустила сингл Pinky Up
Новости, Новости — 9 апреля, 14:45
Автор «Фарго» снимет ремейк хоррора «Оцепеневшие от страха»
Новости, Новости — 9 апреля, 14:35
«Союзмультфильм» переходит на гибрид ИИ и классической анимации
Новости, Новости — 9 апреля, 13:30
Стали известны даты «Оскара» в 2027 и 2028 годах
Новости, Новости — 9 апреля, 12:25
В Google Chrome появились вертикальные вкладки
Все звёзды и инфлюенсеры
Новости, Новости — 9 апреля, 11:30
Фонд борьбы с инсультом ОРБИ проведет благотворительный фестиваль
Новости, Новости — 9 апреля, 10:45
«Пол — это лава»: вышел трейлер девятого сезона «Рика и Морти»
Новости, Новости — 8 апреля, 20:00
Sony Pictures уволит более сотни сотрудников
Новости, Новости — 8 апреля, 19:13
Вышел финальный сезон сериала «Пацаны»
Новости — 8 апреля, 16:21
Мы подписались: как музыкант Тони Резник иронизирует над эстетикой инди-слиза
Новости, Новости — 8 апреля, 12:05
Анна Винтур и Мэрил Стрип появились на обложке Vogue
Новости, Новости — 8 апреля, 12:00
Завершились съемки второго сезона сериала «Олдскул» с Марией Ароновой
Новости, Новости — 8 апреля, 11:01
Глен Пауэлл снимется в комедии о кантри-певце
Новости, Новости — 8 апреля, 09:20
Rhode представили коллаборацию с Джастином Бибером
7.2
Сорвиголова: Рожденный заново
(2 сезон)
7.8
Прыгуны
7.8
Картины дружеских связей
5.2
Ван-Пис (2024)
(1 сезон)
8.2
Бриджертоны
(4 сезон)