Новости — 12 декабря 2021, 10:01

Нейросеть научилась определять звуки в беззвучных видео

Искусственный интеллект обладает множеством способностей. С одной стороны, стремительное развитие технологий может кого-то пугать, а с другой — это серьезно облегчает жизнь и двигает прогресс. Так, разработчики из Nvidia представили нейросеть, которая реалистично воссоздает человеческий голос, а еще через какое-то время слушатели впервые насладились законченной 10-й симфонией Бетховена. Все благодаря научному сотруднику из Федеральной политехнической школы Лозанны EPFL Флориану Коломбо, который смог воссоздать недостающий фрагмент музыкального произведения. И вот у Nvidia новая разработка, которая и вовсе кажется магией: нейросеть научилась подбирать звук для беззвучных видео. 

#INSERT_ARTICLE#

Ученые из Университета Карнеги — Меллона с компанией Runway, разрабатывающей компьютерное программное обеспечение, представили технологию Soundify. Она способна подставлять подходящие звуки в видео, у которого отсутствует аудиодорожка. Над проектом работали Дэвид Чуан-Эн Лин, Анастасис Германидис, Инин Ши, Кристобаль Валенсуэла и Николас Мартеларо.   

Чтобы сопоставить звук с изображением, ученые использовали отдельные программы для анализа аудио и видео. Прежде всего, они разделили исходный ролик по кадрам, анализируя цветовую гистограмму между соседними изображениями. Однако этого было недостаточно, чтобы нейросеть под названием CLIP смогла подставить звук. Далее исследователи классифицировали звуки на две категории. К первой они отнесли объекты на видео, которые производят конкретные четкие звуки. Ученые назвали их «эффектами». К ним отнесли в том числе звонок велосипеда, щелчок камеры и звук клавиатуры. Во вторую же группу вошли фоновые шумы: например, звуки кафе, аэропорта или улицы. Для определения аудио использовали библиотеку звуков Epidemic Sound, в которой собрано более 90 тысяч шумов.

Но и на этом работа ученых не закончилась. Следующим шагом они пропустили изображение через нейросеть, которая сделала метки на каждом кадре. Таким образом нейросеть подобрала пять наиболее подходящих звуков для сцены. По задумке создателей, технология изначально предлагает подставить на видео конкретный звуковой эффект, который ей кажется наиболее удачным, но пользователь может самостоятельно поменять его на один из пяти предложенных вариантов. 

На последнем этапе алгоритм учитывает временные интервалы в видео, когда звук должен воспроизводиться, поскольку, как отметили в отчете ученые, объект может появляться и исчезать из кадра, удаляться и приближаться в видео. Несмотря на то, что технология уже хорошо развита, исследователям все еще есть к чему стремиться. К примеру, сейчас фоновый звук не получится настроить, если вдруг внезапно кадр леса сменится на городскую улицу. Так что, если изначально пользователь выбрал для изображения звук водопада, то нейросеть не додумается заменить его в следующем кадре с другой средой.

#INSERT_ARTICLE#

Подписывайтесь на наш Telegram-канал
Фото: Pexels
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Образ жизни — 16:05, 22 ноября 2024
Американские фэшн-иконы нулевых, сумка рыбака и бюро находок для любителей классных штук для дома: новинки от ТВОЕ, ANNA PEKUN, When I Was _ и других брендов
Новости, Новости — 22 ноября, 16:05
Стивен Кинг анонсировал новую книгу — в ней вернется Холли Гибни
Образ жизни — 11 ноября, 14:51
Экспекто Спамооборонус! Заговоры и обереги от киберпреступников
Новости, Новости — 22 ноября, 13:40
Новый роман по «Ведьмаку» будет про юного Геральта
Кино — 22 ноября, 13:10
«Сердце должно гореть у всех». Олег Савостюк — о сериале «Дайте шоу», парадоксальности страхов и воспитании внутреннего критика
Новости, Новости — 22 ноября, 11:31
Электроника и этно-мотивы: дуэт LAVBLAST выпустил второй альбом More
Новости, Новости — 21 ноября, 19:43
Лука Гуаданьино снимет фильм «Сержант Рок» с Дэниелом Крэйгом
Новости, Новости — 21 ноября, 14:50
Netflix объявил дату премьеры сериала «Нулевой день» с Робертом Де Ниро
Новости, Новости — 21 ноября, 12:38
Джерард Батлер и Мейсон Теймз в трейлере ремейка «Как приручить дракона»
Новости, Новости — 20 ноября, 19:40
Оливия Родриго стала амбассадором бренда Lancôme
Новости, Новости — 20 ноября, 16:00
«Звук» обновил систему рекомендаций и представил кампанию с Сергеем Жуковым
Новости, Новости — 20 ноября, 13:49
Кинофестиваль «Зимний» объявил конкурсную программу
Новости, Новости — 20 ноября, 11:40
Мартин Скорсезе и другие звезды в тизере «Студии» Сета Рогена
Новости, Новости — 19 ноября, 18:21
В США прошла церемония награждения Governors Awards — почетным «Оскаром»
Новости, Новости — 19 ноября, 13:40
Гаспар Ноэ хочет снять фильм с детьми
Новости, Новости — 19 ноября, 11:31
У «Шерлока Холмса 3» появился новый сценарий
Новости, Новости — 19 ноября, 09:39
Нати Пелусо, Хуан Луис Герра, Bizarrap и Karol G: объявлены победители 25-й Latin Grammy
Новости, Новости — 18 ноября, 19:41
Зак Снайдер снимет боевик о полицейских для Netflix
Новости, Новости — 18 ноября, 18:30
«Архстояние» объявило тему юбилейного фестиваля
Кино — 18 ноября, 16:50
Бликующий экран: новинки кино в Сети («Дикий робот», «Подай знак», «Не говори никому», «Затерянное место»)
Новости, Новости — 18 ноября, 16:21
«Я открыл сезон курток, чтобы не замерзали»: SALUKI дропнул альбом BOLSHIE KURTKI
Новости, Новости — 18 ноября, 14:38
В WhatsApp теперь можно сохранять черновики сообщений
Все звёзды и инфлюенсеры
Новости, Новости — 18 ноября, 12:40
Томно, чувственно и сексуально: внимаем альбому группы «СТОУНД» l'amour
Новости, Новости — 15 ноября, 19:08
У «Кинопоиска» появился видеоподкаст «Министерство поп-культуры»
Новости, Новости — 15 ноября, 17:38
Иронично — о прошлом: слушаем новый трек AFELIA «Стерва»
Интервью — 15 ноября, 17:10
Роман Ермаков, «Малышки 18:22», Мария Луттик, Ян Посадский и Дарья Орлова: artsy SRSLY-анкеты
Новости, Новости — 15 ноября, 15:50
Илья Соболев выпустил научный стендап про эволюцию
Новости, Новости — 15 ноября, 13:42
Авангардный звук и вечные смыслы: Сюзанна дропнула EP «железо»
Новости, Новости — 15 ноября, 11:46
Новое место в Москве: итальянский ресторан Senti Menti на Солянке
Новости, Новости — 14 ноября, 19:40
Вышел трейлер документального сериала «Мартин Скорсезе представляет: Святые»
Новости, Новости — 14 ноября, 17:00
Начались съемки «Побудь со мной» — фильма с Романом Маякиным и Петром Федоровым
6.5
Не говори никому
7.4
Комбинация
(1 сезон)
5.5
Руки вверх!
7.8
Преступление и наказание
(1 сезон)
8.2
Граф Монте-Кристо
6
Ворон (2024)
8
Битлджус Битлджус
9
Джокер: Безумие на двоих