Новости — 12 декабря 2021, 10:01

Нейросеть научилась определять звуки в беззвучных видео

Искусственный интеллект обладает множеством способностей. С одной стороны, стремительное развитие технологий может кого-то пугать, а с другой — это серьезно облегчает жизнь и двигает прогресс. Так, разработчики из Nvidia представили нейросеть, которая реалистично воссоздает человеческий голос, а еще через какое-то время слушатели впервые насладились законченной 10-й симфонией Бетховена. Все благодаря научному сотруднику из Федеральной политехнической школы Лозанны EPFL Флориану Коломбо, который смог воссоздать недостающий фрагмент музыкального произведения. И вот у Nvidia новая разработка, которая и вовсе кажется магией: нейросеть научилась подбирать звук для беззвучных видео. 

#INSERT_ARTICLE#

Ученые из Университета Карнеги — Меллона с компанией Runway, разрабатывающей компьютерное программное обеспечение, представили технологию Soundify. Она способна подставлять подходящие звуки в видео, у которого отсутствует аудиодорожка. Над проектом работали Дэвид Чуан-Эн Лин, Анастасис Германидис, Инин Ши, Кристобаль Валенсуэла и Николас Мартеларо.   

Чтобы сопоставить звук с изображением, ученые использовали отдельные программы для анализа аудио и видео. Прежде всего, они разделили исходный ролик по кадрам, анализируя цветовую гистограмму между соседними изображениями. Однако этого было недостаточно, чтобы нейросеть под названием CLIP смогла подставить звук. Далее исследователи классифицировали звуки на две категории. К первой они отнесли объекты на видео, которые производят конкретные четкие звуки. Ученые назвали их «эффектами». К ним отнесли в том числе звонок велосипеда, щелчок камеры и звук клавиатуры. Во вторую же группу вошли фоновые шумы: например, звуки кафе, аэропорта или улицы. Для определения аудио использовали библиотеку звуков Epidemic Sound, в которой собрано более 90 тысяч шумов.

Но и на этом работа ученых не закончилась. Следующим шагом они пропустили изображение через нейросеть, которая сделала метки на каждом кадре. Таким образом нейросеть подобрала пять наиболее подходящих звуков для сцены. По задумке создателей, технология изначально предлагает подставить на видео конкретный звуковой эффект, который ей кажется наиболее удачным, но пользователь может самостоятельно поменять его на один из пяти предложенных вариантов. 

На последнем этапе алгоритм учитывает временные интервалы в видео, когда звук должен воспроизводиться, поскольку, как отметили в отчете ученые, объект может появляться и исчезать из кадра, удаляться и приближаться в видео. Несмотря на то, что технология уже хорошо развита, исследователям все еще есть к чему стремиться. К примеру, сейчас фоновый звук не получится настроить, если вдруг внезапно кадр леса сменится на городскую улицу. Так что, если изначально пользователь выбрал для изображения звук водопада, то нейросеть не додумается заменить его в следующем кадре с другой средой.

#INSERT_ARTICLE#

Подписывайтесь на наш Telegram-канал
Фото: Pexels
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Музыка — 16:50, 19 сентября 2024
Пламя, которое есть в каждом из нас. 15 вопросов HOLLYFLAME
Новости, Новости — 19 сентября, 16:50
Кинофестиваль «Маяк» объявил конкурсную программу
Образ жизни — 18 сентября, 15:19
От сессии до сейшна. Куда ходили и ходят студенты — миллениально-зумерский гид от Антохи МС и Андрея Савочкина
Новости, Новости — 19 сентября, 14:45
«Стальное сердце», «Майор Гром» и TIOT. Рассказываем, как прошел второй «Фандом Фест»
Новости, Новости — 19 сентября, 12:25
Цирк, балет и музыка: «Яндекс» и Imperial Orchestra покажут мистическое шоу по мотивам «Щелкунчика»
Новости, Новости — 18 сентября, 19:13
«Эмили в Париже» продлили на 5-й сезон
Кино — 18 сентября, 19:04
Как вынести креатив из мастерских в пространство города? Рассказывает руководитель Агентства креативных индустрий Гюльнара Агамова
Новости, Новости — 18 сентября, 17:44
Стало известно, когда выйдет роман Пелевина «Круть»
Новости, Новости — 18 сентября, 16:22
Утром йога, днем — браслетерия, вечером — музыка в горах. New Star Weekend выкатил таймлайн фестиваля
Новости, Новости — 18 сентября, 14:42
Никита Кологривый присоединился к касту 3-го сезона «Метода»
Новости, Новости — 17 сентября, 17:11
Новая сказка и новые герои в трейлере сериала «Последний богатырь. Наследие»
Новости, Новости — 17 сентября, 15:10
Начались съемки фильма «Вниз». В главной роли — Егор Крид
Новости, Новости — 17 сентября, 13:09
Стивен Содерберг пишет книгу о создании фильма «Челюсти»
Новости, Новости — 17 сентября, 11:03
Группа «Сироткин» стала куратором нового сезона проекта «Трамплин» от «VK Музыки»
Новости, Новости — 16 сентября, 19:15
Стилизация народных песен в «Фолке» — новом альбоме группы «Звери»
Кино — 16 сентября, 18:26
81-й Венецианский кинофестиваль, записки с острова Лидо: «Вторжение младенцев», «Жатва», «Я все еще здесь»
Новости, Новости — 16 сентября, 17:37
«Сегун», «Медведь» и «Олененок»: названы победители «Эмми»
Новости, Новости — 16 сентября, 16:06
Прикосновение к легенде: Сергей Лазарев — о ремейке песни «Олимпиада-80»
Новости, Новости — 16 сентября, 14:00
Объявлены победители кинофестиваля в Торонто-2024
Новости, Новости — 16 сентября, 12:00
Apple проведет презентацию в октябре. На ней представят семь устройств
Новости, Новости — 16 сентября, 09:56
Глянец, гламур — наш лайфстайл. Евгений Цыганов в тизере сериала «Первый номер»
Кино — 14 сентября, 23:51
81-й Венецианский кинофестиваль, записки с острова Лидо: «Безмолвное братство», «Наконец», «Из Могикан»
Все звёзды и инфлюенсеры
Новости, Новости — 13 сентября, 19:05
Дамиано Давид анонсировал загадочный проект Everywhere
Новости, Новости — 13 сентября, 17:15
Вышел трейлер фильма «Ученик» про молодого Дональда Трампа. В главных ролях — Себастьян Стэн и Джереми Стронг
Новости, Новости — 13 сентября, 15:37
У Федука и Элджея вышел новый фит. Это коллаб с Biicla
Новости, Новости — 13 сентября, 13:35
«Наша Russia» получит продолжение в формате фильма-мюзикла
Новости, Новости — 13 сентября, 11:28
Поп-хаус и ретро-электроника: «ЛАУД» и DJStonik1917 выпустили фит «120ХаусБпм»
Образ жизни — 13 сентября, 11:15
Это видеоблог: BUBBLEGUNSHOW, LABELCOM, Fametime TV и другие каналы в VK Видео, за которыми мы следим
Новости, Новости — 12 сентября, 18:10
Тейлор Свифт забрала 7 наград MTV Video Music Awards и побила рекорд Бейонсе
Новости, Новости — 12 сентября, 16:40
Ученые нашли на Марсе огромный «смайлик». Раньше он был озером
7.1
Собиратель душ
6.9
Максин: Три икса
9
Дом дракона
(2 сезон)
6
Ворон (2024)
8
Эмили в Париже
(4 сезон)
Бордерлендс
8.7
Майор Гром: Игра
7.9
Дэдпул и Росомаха