Развернуть Свернуть
Новости — 1 сентября 2021, 11:25

Появилась нейросеть, которая реалистично воссоздает человеческий голос

Разработчики из Nvidia считают так: искусственный интеллект уже неплохо копирует речь людей, но отличить голос живого человека от робота все еще очень просто. Вся проблема в том, что люди говорят со сложным ритмом, интонациями, каждый со своей скоростью и тембром. Эти детали нейросетям сложно воспроизвести. Точнее, было сложно до последнего времени. В Nvidia попытались сократить этот разрыв и, кажется, у них получилось. На конференции Interspeech 2021 компания представила свои новые технологии, которые позволяют «тренировать» ИИ собственным голосом и получать максимально приближенный к реальности результат. 

Главная из них — RAD-TTS (она даже одержала победу на каком-то конкурсе). В основе этой технологии лежит идея восприятия человеческого голоса как музыкального произведения. Поэтому интерфейс RAD-TTS позволяет определять тональность, длительность и силу говорящего с максимальной точностью. Один из главных навыков этой технологии — произносить речь одного человека голосом другого. В ролике, опубликованном на ютьюб-канале Nvidia, видно, как мужчина зачитывает текст, а нейросеть, сохраняя его интонации и ритм, преобразует голос в женский. Впоследствии с RAD-TTS можно работать как с актером озвучки: попросить выделить определенные слова, изменить темп и много чего еще. 

#INSERT_ARTICLE#

Для демонстрации собственных успехов Nvidia опубликовала серию роликов I Am AI («Я — искусственный интеллект»). Там демонстрируются многие технологии компании, но диктором зачастую выступает нейросеть. Сказать, что искусственно сгенерированный голос не отличить от человеческого, нельзя — это будет ложью. Но, возможно, это самый приближенный вариант из тех, что пока можно услышать. В перспективе подобные технологии могут использоваться не только для озвучивания, но и для воссоздания выступлений легендарных певцов, синхронного перевода, а также для помощи людям с нарушениями голоса.

Среди других относительно свежих разработок Nvidia — SDK Maxine и Canvas. Первая может создавать реалистичные аватары для видеоконференций. Для работы SDK Maxine нужна обычная фотография на вебку. На нее нейросеть наложит артикуляцию и сгенерирует анимированную картинку. А Canvas — это «умная» версия допотопного Paint. При помощи специальных инструментов там можно рисовать схематичные разноцветные картинки, а ИИ создаст из них реалистичные пейзажи. Причем результат преображения виден сразу, и выглядит это магически. 

Подписывайтесь на наш Telegram-канал
Фото: кадр из фильма «Окей, Лекси!»
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Новости — 19:45, 1 декабря 2025
Кое-что о Бене Стиллере. За что мы любим режиссера «Образцового самца»
Новости — 1 декабря, 19:45
Ла-Ла Лэйвэй. Зумерка, которая джазует
Новости, Новости — 1 декабря, 19:30
Элли на маковом поле записала финальный релиз года — трек «Обнимай»
Новости, Новости — 1 декабря, 19:20
В Гонконге прошла кей-поп-премия MAMA AWARDS 2025
Новости, Новости — 1 декабря, 18:30
MAPPA спустя три года представит продолжение аниме «Адский рай»
Новости, Новости — 1 декабря, 17:10
Ник Джонас анонсировал новый альбом
Образ жизни — 13 ноября, 16:12
Путеводитель по континенту от ведьмака Геральта
Новости, Новости — 1 декабря, 16:00
Режиссер «Паразитов» выпустит мультфильм в 2027 году
Новости, Новости — 1 декабря, 15:10
Maison Margiela представил The 12 Days of Margiela — адвент о своих архивах
Новости, Новости — 1 декабря, 14:00
A$AP Rocky стал амбассадором Chanel
Тесты — 26 мая, 14:12
Новости, Новости — 1 декабря, 13:11
Группа «Диктофон» выпустила одноименный альбом
Новости, Новости — 29 ноября, 10:09
BORIS REDWALL представил альбом электронной музыки MONSTER TRUCK MUSIC
Образ жизни — 28 ноября, 19:55
Варвара Нагорнова, Александр Мортаев, Анастасия Нестеренко: новые имена ярмарки современного искусства |catalog|
Новости, Новости — 28 ноября, 17:20
Третий сезон «Магической битвы» впервые расскажет историю Мастера Тенген
Новости, Новости — 28 ноября, 16:10
«Чтобы не обманывать людей, нужно не обманывать себя». Слушаем подкаст «Можно иначе»
Новости, Новости — 28 ноября, 15:00
Хидэо Кодзиму назвали творцом года
Новости, Новости — 28 ноября, 14:00
Alibaba выпустила умные очки с ИИ-ассистентом
Новости, Новости — 28 ноября, 12:15
«Кто помнит своих предков, никогда не будет один». «Дзен» представил документальный проект «Мамины сказки»
Новости, Новости — 28 ноября, 11:26
Вышел сериал «Жар» с Марком Эйдельштейном
Новости, Новости — 27 ноября, 19:15
IKEA показала колонки в форме зеркал и ламп
Новости, Новости — 27 ноября, 17:10
В Москве появилась виртуальная примерочная на базе ИИ
Все звёзды и инфлюенсеры
Новости, Новости — 27 ноября, 16:40
В ChatGPT появились бесплатные групповые чаты
Новости, Новости — 27 ноября, 15:30
Фанаты обрушили Netflix в день выхода новых серий «Очень странных дел»
Новости, Новости — 27 ноября, 14:15
Драма Kokuho стала самым кассовым японским фильмом в истории
Новости, Новости — 27 ноября, 11:05
Смотрим трейлер фильма «Холодное сердце» с Никитой Кологривым и Славой Копейкиным
Новости, Новости — 27 ноября, 10:20
Зумер, сигма и ред-флаг: «Грамота.ру» выбирает слово года
Новости, Новости — 26 ноября, 18:02
Supreme выпустит коллаборацию с Dr. Martens
Новости, Новости — 26 ноября, 17:20
Никола-Ленивец выпустит книгу об истории фестиваля «Архстояние»
Новости, Новости — 26 ноября, 16:10
Spotify купил крупнейший каталог музыкальных сэмплов WhoSampled
Новости, Новости — 26 ноября, 15:04
Ева Грин присоединилась к касту третьего сезона «Уэнсдэй»
7.3
Метод
(3 сезон)
7.2
Киноклуб
(1 сезон)
6.5
Сущность
6.7
Камбэк
(1 сезон)
5
Москва слезам не верит. Все только начинается
(1 сезон)
Бар «Один звонок»
(1 сезон)