Голосовые ИИ — достаточно распространенная история. Так, например, в прошлом году разработчики из Nvidia представили RAD-TTS — нейросеть, которую можно обучать собственным голосом. Главное преимущество этого инструмента в том, что он может имитировать человеческие интонации, ритм — в общем, все то, что обычно неподвластно роботам. Вероятно, у RAD-TTS появился серьезный конкурент. Испанская компания Voicemod запустила бета-версию Voicemod AI Voices — нейросети, которая умеет преобразовывать голос клиента в голос астронавта, пилота, ИИ-ассистента HAL-9000 из «Космической одиссеи» Артура Кларка и даже Моргана Фримана.
На данный момент пользователям доступны восемь вариантов персонажей, но перечень будет постоянно пополняться. Основное отличие Voicemod AI Voices заключается в том, что она меняет голос в режиме реального времени. Как это происходит, можно услышать в ролике, опубликованном на официальном ютьюб-канале разработчика. Выглядит это как чистой воды монтаж: тестировщик диктует текст в микрофон, но его собственного голоса мы не слышим. Он сразу же может говорить как женщина или тот же Фриман — ИИ не задерживается ни на секунду и полностью попадает в артикуляцию молодого человека.
Помимо самого голоса нейросеть имитирует обстоятельства, в которых его можно услышать. За счет специальных эффектов пилот, к примеру, звучит так, будто прямо сейчас находится в полете.
По данным The Verge, голосовые модели были созданы с помощью англоговорящих профессиональных актеров озвучивания, чьи характеристики были приближены к необходимым. Выглядит это следующим образом: актеры начитывают текст по сценариям, затем звукорежиссеры задействуют традиционные методы звукового дизайна, дабы превратить голоса в полноценных персонажей, а потом в дело вступает сама нейросеть, которая работает в режиме реального времени.
Так как ИИ обрабатывает голос клиента на его собственном компьютере, для работы потребуется более мощный процессор. Чтобы убедиться в том, что программа работает идеально, любой желающий может скачать бета-версию Voicemod AI Voices и опробовать ее самостоятельно. Для этого нужно заполнить специальную форму, которую можно найти на сайте и в соцсетях компании. Чтобы тест удался, нужно установить основное приложение Voicemod. У него пока нет версии для Mac, но это временно.
Новая нейросеть нацелена в первую очередь на контентмейкеров. Ее, в частности, можно использовать во время стрима на Twitch, конференции на Discord и на других подобных площадках.