Новости — 1 сентября 2021, 11:25

Появилась нейросеть, которая реалистично воссоздает человеческий голос

Разработчики из Nvidia считают так: искусственный интеллект уже неплохо копирует речь людей, но отличить голос живого человека от робота все еще очень просто. Вся проблема в том, что люди говорят со сложным ритмом, интонациями, каждый со своей скоростью и тембром. Эти детали нейросетям сложно воспроизвести. Точнее, было сложно до последнего времени. В Nvidia попытались сократить этот разрыв и, кажется, у них получилось. На конференции Interspeech 2021 компания представила свои новые технологии, которые позволяют «тренировать» ИИ собственным голосом и получать максимально приближенный к реальности результат. 

Главная из них — RAD-TTS (она даже одержала победу на каком-то конкурсе). В основе этой технологии лежит идея восприятия человеческого голоса как музыкального произведения. Поэтому интерфейс RAD-TTS позволяет определять тональность, длительность и силу говорящего с максимальной точностью. Один из главных навыков этой технологии — произносить речь одного человека голосом другого. В ролике, опубликованном на ютьюб-канале Nvidia, видно, как мужчина зачитывает текст, а нейросеть, сохраняя его интонации и ритм, преобразует голос в женский. Впоследствии с RAD-TTS можно работать как с актером озвучки: попросить выделить определенные слова, изменить темп и много чего еще. 


Для демонстрации собственных успехов Nvidia опубликовала серию роликов I Am AI («Я — искусственный интеллект»). Там демонстрируются многие технологии компании, но диктором зачастую выступает нейросеть. Сказать, что искусственно сгенерированный голос не отличить от человеческого, нельзя — это будет ложью. Но, возможно, это самый приближенный вариант из тех, что пока можно услышать. В перспективе подобные технологии могут использоваться не только для озвучивания, но и для воссоздания выступлений легендарных певцов, синхронного перевода, а также для помощи людям с нарушениями голоса.

Среди других относительно свежих разработок Nvidia — SDK Maxine и Canvas. Первая может создавать реалистичные аватары для видеоконференций. Для работы SDK Maxine нужна обычная фотография на вебку. На нее нейросеть наложит артикуляцию и сгенерирует анимированную картинку. А Canvas — это «умная» версия допотопного Paint. При помощи специальных инструментов там можно рисовать схематичные разноцветные картинки, а ИИ создаст из них реалистичные пейзажи. Причем результат преображения виден сразу, и выглядит это магически. 

Подписывайтесь на наш Telegram-канал
Фото: кадр из фильма «Окей, Лекси!»
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Музыка — 15:40, 16 мая 2025
Flo Rida, Лагутенко, The Rasmus: большие артисты на «Евровидении»
Новости, Новости — 16 мая, 15:40
Saint City Lovers, DJ Stonik1917 и i61: фестиваль «Планета K-30» анонсировал вторую волну исполнителей и локацию ивента
Новости, Новости — 5 мая, 13:46
Петля времени, мечты о Москве и путь к себе: на PREMIER вышла фантастическая комедия «Один хороший день»
Новости, Новости — 16 мая, 14:08
«Снова на одной волне»: «Питер FM» выйдет в повторный прокат
Музыка — 16 мая, 11:40
Вся музыка важна. Гид по «BandLink ШоуКейс фестивалю»
Новости, Новости — 15 мая, 17:30
Apple разрабатывает технологию для управления iPhone силой мысли
Новости, Новости — 15 мая, 15:30
Фанни Ардан и Луи Гаррель сыграют в новом фильме Кирилла Серебренникова
Новости, Новости — 15 мая, 13:55
Новые персонажи и сказочный Питер в трейлере 2-го сезона «Волшебного участка»
Кино — 15 мая, 13:37
По следам 47-го Московского кинофестиваля: «Туда», «Эвакуация», «Старуха с ножом»
Новости, Новости — 15 мая, 11:40
Okko выпустит документалку о Паше Технике
Новости, Новости — 14 мая, 17:30
Онлайн-кинотеатр PREMIER запускает киноклуб
Новости, Новости — 14 мая, 16:00
Feduk, Дора и ICEGERGERT: «Пари Фест» в Нижнем Новгороде объявил первых артистов
Интервью — 14 мая, 15:06
На пару слов: интервью с Amirchik о любви и не только
Новости, Новости — 14 мая, 13:27
MONA написала саундтрек к аудиосериалу «Ониксовый шторм»
Музыка — 13 мая, 20:28
Волна нереального свэга. 13 вопросов Мэйби Бэйби
Новости, Новости — 13 мая, 17:30
Александр Хант поставит сериал «Фурия» по комиксам Bubble Comics
Новости, Новости — 13 мая, 16:00
Kid Cudi снимет свой первый фильм и исполнит в нем главную роль
Новости, Новости — 13 мая, 13:24
Новый маньяк и новые жертвы в трейлере 2-го сезона «Фишера»
Новости, Новости — 13 мая, 11:03
У фильма «Красный шелк» будет сиквел
Новости, Новости — 12 мая, 16:50
Майки Мэдисон сыграет в «Рептилии» — новом триллере с Кирстен Данст
Новости, Новости — 12 мая, 14:39
Стало известно, когда начнутся съемки перезапуска «Горца» с Генри Кавиллом
Образ жизни — 12 мая, 14:04
Что бы послушать? «Суперсилы», «Человек уязвимый», «Мужик, соберись!» и другие новые подкасты
Все звёзды и инфлюенсеры
Интервью — 10 мая, 13:05
«Я не мог объяснить людям просто через музыку, кто я такой». Большое интервью SRSLY с Федей BOOKER. Часть 1
Новости, Новости — 10 мая, 12:00
Алекс Гарленд станет режиссером фильма по игре Elden Ring
Новости, Новости — 9 мая, 16:00
Мэтт Ривз ушел с поста режиссера «Бэтмена 2»
Новости, Новости — 9 мая, 14:14
На «Золотом глобусе» начнут награждать лучшие подкасты
Новости, Новости — 9 мая, 12:00
Baidu разрабатывает ИИ-переводчик с языка животных на человеческий
Новости, Новости — 8 мая, 16:00
Валерия Гай Германика снимет хоррор-сериал с Леонидом Якубовичем
Новости, Новости — 8 мая, 14:00
Вышел трейлер фильма по «Долгой прогулке» Стивена Кинга
Новости, Новости — 8 мая, 12:00
Маргарет Куолли снимется в фильме «Любовь твоей жизни», который продюсирует Райан Гослинг
Новости, Новости — 7 мая, 17:30
Lego представила 10 полноразмерных болидов для «Формулы-1»
Бриджит Джонс: Без ума от мальчишки
8.1
Смерть единорога
5.1
Обезьяна
4.2
Денискины рассказы
(1 сезон)
8.3
Белый лотос
(3 сезон)
7.7
Микки-17
7.5
Кончится лето
7.3
Громовержцы