Новости — 12 декабря 2021, 10:01

Нейросеть научилась определять звуки в беззвучных видео

Искусственный интеллект обладает множеством способностей. С одной стороны, стремительное развитие технологий может кого-то пугать, а с другой — это серьезно облегчает жизнь и двигает прогресс. Так, разработчики из Nvidia представили нейросеть, которая реалистично воссоздает человеческий голос, а еще через какое-то время слушатели впервые насладились законченной 10-й симфонией Бетховена. Все благодаря научному сотруднику из Федеральной политехнической школы Лозанны EPFL Флориану Коломбо, который смог воссоздать недостающий фрагмент музыкального произведения. И вот у Nvidia новая разработка, которая и вовсе кажется магией: нейросеть научилась подбирать звук для беззвучных видео. 

#INSERT_ARTICLE#

Ученые из Университета Карнеги — Меллона с компанией Runway, разрабатывающей компьютерное программное обеспечение, представили технологию Soundify. Она способна подставлять подходящие звуки в видео, у которого отсутствует аудиодорожка. Над проектом работали Дэвид Чуан-Эн Лин, Анастасис Германидис, Инин Ши, Кристобаль Валенсуэла и Николас Мартеларо.   

Чтобы сопоставить звук с изображением, ученые использовали отдельные программы для анализа аудио и видео. Прежде всего, они разделили исходный ролик по кадрам, анализируя цветовую гистограмму между соседними изображениями. Однако этого было недостаточно, чтобы нейросеть под названием CLIP смогла подставить звук. Далее исследователи классифицировали звуки на две категории. К первой они отнесли объекты на видео, которые производят конкретные четкие звуки. Ученые назвали их «эффектами». К ним отнесли в том числе звонок велосипеда, щелчок камеры и звук клавиатуры. Во вторую же группу вошли фоновые шумы: например, звуки кафе, аэропорта или улицы. Для определения аудио использовали библиотеку звуков Epidemic Sound, в которой собрано более 90 тысяч шумов.

#INSERT_ARTICLE#

Но и на этом работа ученых не закончилась. Следующим шагом они пропустили изображение через нейросеть, которая сделала метки на каждом кадре. Таким образом нейросеть подобрала пять наиболее подходящих звуков для сцены. По задумке создателей, технология изначально предлагает подставить на видео конкретный звуковой эффект, который ей кажется наиболее удачным, но пользователь может самостоятельно поменять его на один из пяти предложенных вариантов. 

На последнем этапе алгоритм учитывает временные интервалы в видео, когда звук должен воспроизводиться, поскольку, как отметили в отчете ученые, объект может появляться и исчезать из кадра, удаляться и приближаться в видео. Несмотря на то, что технология уже хорошо развита, исследователям все еще есть к чему стремиться. К примеру, сейчас фоновый звук не получится настроить, если вдруг внезапно кадр леса сменится на городскую улицу. Так что, если изначально пользователь выбрал для изображения звук водопада, то нейросеть не додумается заменить его в следующем кадре с другой средой.

#INSERT_ARTICLE#

Подписывайтесь на наш Telegram-канал
Фото: Pexels
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Музыка — 20:05, 28 октября 2025
Панельки, Oasis и «великий русский рандом». 19 вопросов рок-группе «синдром главного героя»
Интервью — 28 октября, 20:05
«Лютик», «МОЛОДОСТЬ ВНУТРИ», Nomad Punk и «внимание брусника!» рассказали SRSLY о любимых мультиках
Новости, Новости — 28 октября, 19:15
Хоррор «Обитель» с Питом Дэвидсоном покажут в России
Новости, Новости — 28 октября, 18:30
Том Форд снимет фильм по роману «Плач к небесам»
Новости, Новости — 28 октября, 16:50
Студия Ghibli выпустила плюшевые игрушки
Новости, Новости — 28 октября, 14:55
В «ГЭС-2» пройдет книжный фестиваль
Новости, Новости — 28 октября, 13:50
Квентин Тарантино сыграет первую за 30 лет большую роль в кино
Образ жизни — 28 октября, 13:30
Главная офисная сирена. Разбираем стиль Тамары Кожемятько из «Папиных дочек»
Образ жизни — 27 октября, 19:30
О мышах и людях: как «История Резе» напоминает нам о человечности
Тесты — 26 мая, 14:12
Новости, Новости — 27 октября, 19:00
Марго Робби может сыграть нового «Американского психопата»
Новости, Новости — 27 октября, 16:00
Состоялся показ Vogue World, посвященный связи моды и кинематографа
Новости, Новости — 27 октября, 15:00
Эмир Кустурица поставит фильмы по книгам русских писателей
Новости, Новости — 27 октября, 15:00
Известна дата масштабного обновления Fallout 76
Новости, Новости — 27 октября, 14:00
Хейли Уильямс выпустила песню Good Ol’ Days
Новости, Новости — 27 октября, 13:40
Легенды сумо, голос Харухи Судзумии, лучший косплей: как прошла HINODE JAPAN
Музыка — 25 октября, 13:35
Коля Редькин, Полина Другомилова, Даня Порнорэп: SRSLY-анкеты тех, кто беседует о рэпе
Новости, Новости — 24 октября, 19:40
Об ограблении Лувра снимут документальный фильм
Новости, Новости — 24 октября, 18:40
Дора, Lida, «ХЛЕБ»: «Comic Con Игромир» объявил музыкальную программу
Новости, Новости — 24 октября, 15:45
Джейн Шенбрун снимет сериал по комиксам Чарльза Бернса «Черная дыра»
Новости, Новости — 24 октября, 13:50
Reebok анонсировали умное кольцо
Образ жизни — 24 октября, 12:30
Любимая работа не ответит вам взаимностью. 3 книги о современном труде
Все звёзды и инфлюенсеры
Новости, Новости — 24 октября, 11:55
Netflix представил трейлер пятого сезона «Эмили в Париже»
Новости, Новости — 23 октября, 17:30
Майли Сайрус записала трек для фильма «Аватар: Пламя и пепел»
Новости, Новости — 23 октября, 16:20
Вышел первый трейлер нового сериала от автора «Во все тяжкие»
Новости, Новости — 23 октября, 15:10
Известна дата выхода третьего сезона «Метода»
Новости, Новости — 23 октября, 14:15
«Я готов и взволнован»: группа Bon Jovi едет в первый тур после операции солиста
Новости, Новости — 23 октября, 09:30
У мультфильма «Митчеллы против машин» будет сиквел
Новости, Новости — 22 октября, 17:00
VK Fest 2026 объявил даты
Новости, Новости — 22 октября, 16:16
Известна дата премьеры финального сезона «Вампиров средней полосы»
Музыка — 22 октября, 14:19
Девочка, которой было страшно. Рассказываем о Лили Аллен
7.4
Дом Гиннесса
(1 сезон)
5
Москва слезам не верит. Все только начинается
(1 сезон)
Бар «Один звонок»
(1 сезон)
8.1
Смерть единорога
4.2
Денискины рассказы
(1 сезон)
7.7
Микки-17
7.5
Кончится лето
7.3
Громовержцы