Новости — 1 сентября 2021, 11:25

Появилась нейросеть, которая реалистично воссоздает человеческий голос

Разработчики из Nvidia считают так: искусственный интеллект уже неплохо копирует речь людей, но отличить голос живого человека от робота все еще очень просто. Вся проблема в том, что люди говорят со сложным ритмом, интонациями, каждый со своей скоростью и тембром. Эти детали нейросетям сложно воспроизвести. Точнее, было сложно до последнего времени. В Nvidia попытались сократить этот разрыв и, кажется, у них получилось. На конференции Interspeech 2021 компания представила свои новые технологии, которые позволяют «тренировать» ИИ собственным голосом и получать максимально приближенный к реальности результат. 

Главная из них — RAD-TTS (она даже одержала победу на каком-то конкурсе). В основе этой технологии лежит идея восприятия человеческого голоса как музыкального произведения. Поэтому интерфейс RAD-TTS позволяет определять тональность, длительность и силу говорящего с максимальной точностью. Один из главных навыков этой технологии — произносить речь одного человека голосом другого. В ролике, опубликованном на ютьюб-канале Nvidia, видно, как мужчина зачитывает текст, а нейросеть, сохраняя его интонации и ритм, преобразует голос в женский. Впоследствии с RAD-TTS можно работать как с актером озвучки: попросить выделить определенные слова, изменить темп и много чего еще. 

#INSERT_ARTICLE#

Для демонстрации собственных успехов Nvidia опубликовала серию роликов I Am AI («Я — искусственный интеллект»). Там демонстрируются многие технологии компании, но диктором зачастую выступает нейросеть. Сказать, что искусственно сгенерированный голос не отличить от человеческого, нельзя — это будет ложью. Но, возможно, это самый приближенный вариант из тех, что пока можно услышать. В перспективе подобные технологии могут использоваться не только для озвучивания, но и для воссоздания выступлений легендарных певцов, синхронного перевода, а также для помощи людям с нарушениями голоса.

Среди других относительно свежих разработок Nvidia — SDK Maxine и Canvas. Первая может создавать реалистичные аватары для видеоконференций. Для работы SDK Maxine нужна обычная фотография на вебку. На нее нейросеть наложит артикуляцию и сгенерирует анимированную картинку. А Canvas — это «умная» версия допотопного Paint. При помощи специальных инструментов там можно рисовать схематичные разноцветные картинки, а ИИ создаст из них реалистичные пейзажи. Причем результат преображения виден сразу, и выглядит это магически. 

Подписывайтесь на наш Telegram-канал
Фото: кадр из фильма «Окей, Лекси!»
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Бизнес — 10:40, 11 марта 2026
Сцепка с корнями. Интервью с соосновательницей бренда ARNY PRAHT Анной Прахт
Новости, Новости — 11 марта, 10:40
Росалия написала музыку для третьего сезона «Эйфории»
Новости, Новости — 11 марта, 09:26
Disney+ готовит драматический сериал о фее Динь-Динь
Новости, Новости — 10 марта, 23:45
Появился первый трейлер фильма Гая Ричи «Грязные деньги»
Новости — 10 марта, 20:30
Мама Коляна, медсестра Дана и Леди Дэнбери: 9 крутых женских персонажей
Новости, Новости — 10 марта, 19:20
Вышел трейлер сериала «У Марго проблемы с деньгами» с Эль Фаннинг
Новости, Новости — 10 марта, 18:22
Из кей-поп-группы ENHYPEN ушел Хисын
Новости, Новости — 10 марта, 14:00
Арнольд Шварценеггер вернется к роли Конана-варвара
Новости, Новости — 10 марта, 13:18
BTS запускают мерч к выходу альбома Arirang
Новости, Новости — 10 марта, 11:15
Неофолк-певица DRIADA представила сингл «Локоны»
Новости, Новости — 10 марта, 09:20
Новое место в Москве: фабрика кастомизации VANCUSTOM ART STORE на Трубной площади
Новости, Новости — 6 марта, 18:15
Вышел трейлер финального сезона «Пацанов»
Новости, Новости — 6 марта, 16:45
Энн Хэтуэй выпустила трек для фильма студии A24 совместно с Charli XCX
Новости, Новости — 6 марта, 15:15
Питер Джексон получит почетную «Золотую пальмовую ветвь» на Каннском кинофестивале
Новости, Новости — 6 марта, 13:10
Brick Labs выпустили конструкторы по «Смешарикам»
Новости, Новости — 6 марта, 12:00
Завершились съемки пятого сезона сериала «Папины дочки. Новые»
Новости, Новости — 6 марта, 10:43
Ринго Старр из The Beatles анонсировал кантри-альбом Long Long Road
Новости, Новости — 6 марта, 09:16
Рената Литвинова приняла участие в показе Matières Fécales в Париже
Новости, Новости — 5 марта, 23:55
Запустился подкаст, исследующий вклад женщин в историю городов
Новости, Новости — 5 марта, 15:40
Сериал «Медведь» закончится на пятом сезоне
Новости, Новости — 5 марта, 14:55
Вышел трейлер концертного фильма BTS на Netflix
Новости, Новости — 5 марта, 13:00
Появились трейлер и постер фильма «Не одна дома 3. Выпускной»
Все звёзды и инфлюенсеры
Кино — 5 марта, 12:52
«One Piece. Большой куш», «Острые козырьки: Бессмертный», «У меня очень плохое предчувствие» и еще 3 проекта Netflix, которые надо ловить в марте
Новости, Новости — 5 марта, 11:10
Елизавета Базыкина, Ася Лавринович и Ида Галич: «Форум в большом городе» объявил полную программу
Новости, Новости — 4 марта, 21:00
ZOLOTO выпускает концертный фильм «Перевоплотиться»
Новости, Новости — 4 марта, 19:15
Появился треклист нового альбома BTS Arirang
Новости, Новости — 4 марта, 18:33
Московская неделя моды пройдет с 14 по 19 марта
Новости, Новости — 4 марта, 14:40
Мейси Стелла и Татум Грейс Хопкинс исполнят главные роли в экранизации Life Is Strange
Новости, Новости — 4 марта, 13:15
Warner Bros. запускает фильм по «Игре престолов» об Эйгоне I Таргариене
Новости, Новости — 4 марта, 12:00
В Москве пройдет фестиваль научного кино «ФАНК»
Новости, Новости — 4 марта, 10:54
IOWA, «Сова» и Loqiemean: фестиваль «Стереолето» объявил вторую волну артистов