Новости — 1 сентября 2021, 11:25

Появилась нейросеть, которая реалистично воссоздает человеческий голос

Разработчики из Nvidia считают так: искусственный интеллект уже неплохо копирует речь людей, но отличить голос живого человека от робота все еще очень просто. Вся проблема в том, что люди говорят со сложным ритмом, интонациями, каждый со своей скоростью и тембром. Эти детали нейросетям сложно воспроизвести. Точнее, было сложно до последнего времени. В Nvidia попытались сократить этот разрыв и, кажется, у них получилось. На конференции Interspeech 2021 компания представила свои новые технологии, которые позволяют «тренировать» ИИ собственным голосом и получать максимально приближенный к реальности результат. 

Главная из них — RAD-TTS (она даже одержала победу на каком-то конкурсе). В основе этой технологии лежит идея восприятия человеческого голоса как музыкального произведения. Поэтому интерфейс RAD-TTS позволяет определять тональность, длительность и силу говорящего с максимальной точностью. Один из главных навыков этой технологии — произносить речь одного человека голосом другого. В ролике, опубликованном на ютьюб-канале Nvidia, видно, как мужчина зачитывает текст, а нейросеть, сохраняя его интонации и ритм, преобразует голос в женский. Впоследствии с RAD-TTS можно работать как с актером озвучки: попросить выделить определенные слова, изменить темп и много чего еще. 

#INSERT_ARTICLE#

Для демонстрации собственных успехов Nvidia опубликовала серию роликов I Am AI («Я — искусственный интеллект»). Там демонстрируются многие технологии компании, но диктором зачастую выступает нейросеть. Сказать, что искусственно сгенерированный голос не отличить от человеческого, нельзя — это будет ложью. Но, возможно, это самый приближенный вариант из тех, что пока можно услышать. В перспективе подобные технологии могут использоваться не только для озвучивания, но и для воссоздания выступлений легендарных певцов, синхронного перевода, а также для помощи людям с нарушениями голоса.

Среди других относительно свежих разработок Nvidia — SDK Maxine и Canvas. Первая может создавать реалистичные аватары для видеоконференций. Для работы SDK Maxine нужна обычная фотография на вебку. На нее нейросеть наложит артикуляцию и сгенерирует анимированную картинку. А Canvas — это «умная» версия допотопного Paint. При помощи специальных инструментов там можно рисовать схематичные разноцветные картинки, а ИИ создаст из них реалистичные пейзажи. Причем результат преображения виден сразу, и выглядит это магически. 

Подписывайтесь на наш Telegram-канал
Фото: кадр из фильма «Окей, Лекси!»
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Новости — 17:45, 19 февраля 2026
Графские развалины. Рецензия на фильм «Грозовой перевал»
Новости, Новости — 19 февраля, 17:45
Дуа Липа стала глобальным амбассадором Bulgari
Новости, Новости — 19 февраля, 15:40
Названы лучшие фотографии природы по версии Sony World Photography Awards-2026
Образ жизни — 19 февраля, 14:30
Трансильвания, альтер эго и секретное умение. 8 вопросов художнице NorthxCarolina
Новости, Новости — 19 февраля, 14:15
Bad Bunny исполнит главную роль в исторической драме Porto Rico
Новости, Новости — 19 февраля, 13:00
Вышел трейлер фильма «Твое сердце будет разбито» по Анне Джейн
Новости, Новости — 19 февраля, 11:33
Марк Эйдельштейн присоединился к касту сериала «Хакеры»
Новости, Новости — 18 февраля, 20:12
Спецвыпуск «Ханны Монтаны» выйдет 24 марта
Новости, Новости — 18 февраля, 19:30
Российский фильм «Вторая кожа» получил приз Tiger Shorts в Роттердаме
Новости, Новости — 18 февраля, 18:18
Вайнона Райдер и Хадсон Уильямс стали амбассадорами Balenciaga
Новости, Новости — 18 февраля, 16:25
Activision отключит серверы Call of Duty Warzone Mobile
Новости, Новости — 18 февраля, 15:22
Игра Hunter×Hunter Nen×Survivor вышла на смартфонах
Новости, Новости — 18 февраля, 13:10
На Воробьевых горах пройдет турнир по метанию снежков
Новости, Новости — 18 февраля, 11:55
Разработчики «Русов против Ящеров» выпустят игру о котиках
Новости, Новости — 17 февраля, 20:27
Седзе-манга «Красная река» получит аниме-экранизацию
Новости, Новости — 17 февраля, 19:40
В Fortnite готовят кроссовер с аниме «Поднятие уровня в одиночку»
Новости, Новости — 17 февраля, 18:43
Apple проведет презентацию 4 марта
Новости, Новости — 17 февраля, 17:10
В Липецкой области сожгут чучело лабубу на Масленицу
Новости, Новости — 17 февраля, 16:05
Группа UBEL представила мини-альбом «Насквозь»
Новости, Новости — 17 февраля, 13:55
Экранизация романа Стивена Кинга «Кэрри» выйдет осенью 2026 года
Новости, Новости — 17 февраля, 12:02
Лана Дель Рей выпустила сингл в соавторстве с мужем
Новости, Новости — 17 февраля, 10:35
«Плюс Студия» выпустит приключенческую игру «Война Миров: Сибирь»
Все звёзды и инфлюенсеры
Новости, Новости — 17 февраля, 09:24
Появился кадр из фильма «Идиот(ы)» о жизни Анны Сниткиной и Федора Достоевского
Музыка — 16 февраля, 19:40
Послушай демку: каким получился альбом Joji — Piss in the Wind
Новости, Новости — 16 февраля, 19:30
Жора Крыжовников готовит второй сезон «Слова пацана». Но это не точно
Новости, Новости — 16 февраля, 18:25
Ретрофутуризм и андеграунд: в Москве пройдет фестиваль PLUS+ONE
Новости, Новости — 16 февраля, 17:25
Бренд Miu Miu представил короткометражный фильм «Дисциплина»
Новости, Новости — 16 февраля, 16:30
Дизайнер Hello Kitty уходит на пенсию спустя 40 лет работы
Новости, Новости — 16 февраля, 15:44
В России выйдет фолк-хоррор «Ловушка для кролика» с Девом Пателем
Новости, Новости — 16 февраля, 10:45
TERELYA выпустила двойной сингл «Лав»
Кино — 14 февраля, 17:11
Бум банка... У этой девочки свиданка! Вспоминаем рандеву из сериалов
7.7
Счастлив, когда ты нет
6.8
Здесь был Юра
Мистер Ноготь
(1 сезон)
GOAT: Мечтай по-крупному
6
Реальные пацаны
(1 сезон)