Развернуть Свернуть
Новости — 1 сентября 2021, 11:25

Появилась нейросеть, которая реалистично воссоздает человеческий голос

Разработчики из Nvidia считают так: искусственный интеллект уже неплохо копирует речь людей, но отличить голос живого человека от робота все еще очень просто. Вся проблема в том, что люди говорят со сложным ритмом, интонациями, каждый со своей скоростью и тембром. Эти детали нейросетям сложно воспроизвести. Точнее, было сложно до последнего времени. В Nvidia попытались сократить этот разрыв и, кажется, у них получилось. На конференции Interspeech 2021 компания представила свои новые технологии, которые позволяют «тренировать» ИИ собственным голосом и получать максимально приближенный к реальности результат. 

Главная из них — RAD-TTS (она даже одержала победу на каком-то конкурсе). В основе этой технологии лежит идея восприятия человеческого голоса как музыкального произведения. Поэтому интерфейс RAD-TTS позволяет определять тональность, длительность и силу говорящего с максимальной точностью. Один из главных навыков этой технологии — произносить речь одного человека голосом другого. В ролике, опубликованном на ютьюб-канале Nvidia, видно, как мужчина зачитывает текст, а нейросеть, сохраняя его интонации и ритм, преобразует голос в женский. Впоследствии с RAD-TTS можно работать как с актером озвучки: попросить выделить определенные слова, изменить темп и много чего еще. 

#INSERT_ARTICLE#

Для демонстрации собственных успехов Nvidia опубликовала серию роликов I Am AI («Я — искусственный интеллект»). Там демонстрируются многие технологии компании, но диктором зачастую выступает нейросеть. Сказать, что искусственно сгенерированный голос не отличить от человеческого, нельзя — это будет ложью. Но, возможно, это самый приближенный вариант из тех, что пока можно услышать. В перспективе подобные технологии могут использоваться не только для озвучивания, но и для воссоздания выступлений легендарных певцов, синхронного перевода, а также для помощи людям с нарушениями голоса.

Среди других относительно свежих разработок Nvidia — SDK Maxine и Canvas. Первая может создавать реалистичные аватары для видеоконференций. Для работы SDK Maxine нужна обычная фотография на вебку. На нее нейросеть наложит артикуляцию и сгенерирует анимированную картинку. А Canvas — это «умная» версия допотопного Paint. При помощи специальных инструментов там можно рисовать схематичные разноцветные картинки, а ИИ создаст из них реалистичные пейзажи. Причем результат преображения виден сразу, и выглядит это магически. 

Подписывайтесь на наш Telegram-канал
Фото: кадр из фильма «Окей, Лекси!»
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Кино — 18:45, 18 сентября 2025
82-й Венецианский кинофестиваль, записки с острова Лидо: «Франкенштейн», «Отец, мать, сестра, брат», «100 ночей героя», «Провод мертвеца»
Новости, Новости — 18 сентября, 18:45
«Союзмультфильм» выпустит аниме по мотивам «Чайки» Чехова
Образ жизни — 14 августа, 18:10
ИИ, футуризм и роскошный максимум: какой будет Москва в 2030 году? Решать тебе
Новости, Новости — 18 сентября, 17:30
В Москве пройдет фестиваль японской культуры HINODE
Новости, Новости — 18 сентября, 16:35
Вы слышите музыку? Киллиан Мерфи сыграл диджей-сет на фестивале в Ирландии
Новости, Новости — 18 сентября, 13:30
Адель заключила многомиллионный контракт на издание мемуаров
Новости, Новости — 18 сентября, 12:10
Аврил Лавин выпустила вино, вдохновленное треком Complicated
Новости, Новости — 17 сентября, 17:00
Премьера третьего сезона «Эйфории» состоится в 2026 году
Новости, Новости — 17 сентября, 15:36
Pop Mart дропнет коллекцию игрушек по сериалу «Телепузики»
Новости, Новости — 17 сентября, 14:48
Известна дата выхода третьего сезона «Дома Дракона»
Тесты — 26 мая, 14:12
Новости, Новости — 17 сентября, 13:45
Вышел трейлер фильма «Горничная» с Сидни Суини
Новости, Новости — 16 сентября, 21:06
Xiaomi анонсировали новое поколение смартфонов
Новости, Новости — 16 сентября, 20:02
Стример Nix побил рекорд русскоязычного Twitch
Новости, Новости — 16 сентября, 15:20
У «Бургер Кинга» коллаборация с «Атакой Титанов»
Новости, Новости — 16 сентября, 13:50
Песни из «Кей-поп-охотниц на демонов» возглавили Billboard 200
Новости, Новости — 16 сентября, 12:40
Чарли Ханнэм в трейлере 3-го сезона «Монстра»
Новости, Новости — 16 сентября, 11:30
Кайл Маклоклен будет брать интервью у молодых актеров и художников
Новости, Новости — 16 сентября, 10:00
Смотрим трейлер байопика «Спрингстин: Избавь меня от небытия» с Джереми Аллен Уайтом
Новости, Новости — 15 сентября, 18:30
Объявлены победители премии «Эмми-2025»
Интервью — 15 сентября, 17:30
Алло, Balenciaga? Интервью с моделью Полиной Дворецкой
Новости, Новости — 15 сентября, 16:40
Вышел трейлер «Хронологии воды» — режиссерского дебюта Кристен Стюарт
Все звёзды и инфлюенсеры
Новости, Новости — 15 сентября, 15:10
Сиквел «Братьев Супер Марио» получил первый тизер
Новости, Новости — 15 сентября, 13:50
«Хэмнет» и «Франкенштейн»: объявлены победители кинофестиваля в Торонто
Новости, Новости — 15 сентября, 12:10
«Фандом Фест» раскрыл программу лектория и новых участников
Новости, Новости — 13 сентября, 12:00
Вышел трейлер байопика «Кристи» с Сидни Суини
Новости, Новости — 12 сентября, 20:25
Илья Гадаев, Сироткин, DJ K.SOUL и Эвелина Малинкина в первом выпуске «книжного клуба афéлии»
Кино — 12 сентября, 19:20
Звонок для учителя. 5 сериалов про преподов
Новости, Новости — 12 сентября, 14:25
Смотрим тизер-трейлер сериала «Отпечатки» с Дмитрием Чеботаревым и Оксаной Акиньшиной
Новости, Новости — 12 сентября, 12:20
Pantone показал главные цвета Недели моды в Нью-Йорке
Образ жизни — 12 сентября, 11:55
Simple Symmetry, таро и чпокательная. Как редакция SRSLY на AFTERDARK ходила
Дом Гиннесса
(1 сезон)
Москва слезам не верит. Все только начинается
(1 сезон)
«Бар "Один звонок"»
(1 сезон)
8.1
Смерть единорога
4.2
Денискины рассказы
(1 сезон)
7.7
Микки-17
7.5
Кончится лето
7.3
Громовержцы