Новости — 17 июня 2022, 12:32

Появилась нейросеть, которая меняет голос в режиме реального времени. Можно почувствовать себя Морганом Фриманом или пилотом самолета

Голосовые ИИ — достаточно распространенная история. Так, например, в прошлом году разработчики из Nvidia представили RAD-TTS — нейросеть, которую можно обучать собственным голосом. Главное преимущество этого инструмента в том, что он может имитировать человеческие интонации, ритм — в общем, все то, что обычно неподвластно роботам. Вероятно, у RAD-TTS появился серьезный конкурент. Испанская компания Voicemod запустила бета-версию Voicemod AI Voices — нейросети, которая умеет преобразовывать голос клиента в голос астронавта, пилота, ИИ-ассистента HAL-9000 из «Космической одиссеи» Артура Кларка и даже Моргана Фримана.

На данный момент пользователям доступны восемь вариантов персонажей, но перечень будет постоянно пополняться. Основное отличие Voicemod AI Voices заключается в том, что она меняет голос в режиме реального времени. Как это происходит, можно услышать в ролике, опубликованном на официальном ютьюб-канале разработчика. Выглядит это как чистой воды монтаж: тестировщик диктует текст в микрофон, но его собственного голоса мы не слышим. Он сразу же может говорить как женщина или тот же Фриман — ИИ не задерживается ни на секунду и полностью попадает в артикуляцию молодого человека.  


Помимо самого голоса нейросеть имитирует обстоятельства, в которых его можно услышать. За счет специальных эффектов пилот, к примеру, звучит так, будто прямо сейчас находится в полете. 

По данным The Verge, голосовые модели были созданы с помощью англоговорящих профессиональных актеров озвучивания, чьи характеристики были приближены к необходимым. Выглядит это следующим образом: актеры начитывают текст по сценариям, затем звукорежиссеры задействуют традиционные методы звукового дизайна, дабы превратить голоса в полноценных персонажей, а потом в дело вступает сама нейросеть, которая работает в режиме реального времени. 

Так как ИИ обрабатывает голос клиента на его собственном компьютере, для работы потребуется более мощный процессор. Чтобы убедиться в том, что программа работает идеально, любой желающий может скачать бета-версию Voicemod AI Voices и опробовать ее самостоятельно. Для этого нужно заполнить специальную форму, которую можно найти на сайте и в соцсетях компании. Чтобы тест удался, нужно установить основное приложение Voicemod. У него пока нет версии для Mac, но это временно. 

Новая нейросеть нацелена в первую очередь на контентмейкеров. Ее, в частности, можно использовать во время стрима на Twitch, конференции на Discord и на других подобных площадках. 

Фото: Кадр из сериала «Discovery: Сквозь пространство и время с Морганом Фриманом»
Новости — 16:00, 3 мая
«Дом у дороги» получит сиквел. Его снимет Гай Ричи
Новости — 14:00, 3 мая
DC поставила на паузу «Сержанта Рока» с Колином Фарреллом
Образ жизни — 12:31, 3 мая
Кэти Перри в космосе, Лана Дель Рей на Чистых прудах и другие странные новости апреля
Новости — 16:00, 2 мая
Новое дело «Всадников» в трейлере «Иллюзии обмана 3»
Новости — 14:50, 2 мая
«Грязь» выпустила новую версию трека «Расскажи мне о любви». Это фит с ЛСП