Новости — 12 декабря 2021, 10:01

Нейросеть научилась определять звуки в беззвучных видео

Искусственный интеллект обладает множеством способностей. С одной стороны, стремительное развитие технологий может кого-то пугать, а с другой — это серьезно облегчает жизнь и двигает прогресс. Так, разработчики из Nvidia представили нейросеть, которая реалистично воссоздает человеческий голос, а еще через какое-то время слушатели впервые насладились законченной 10-й симфонией Бетховена. Все благодаря научному сотруднику из Федеральной политехнической школы Лозанны EPFL Флориану Коломбо, который смог воссоздать недостающий фрагмент музыкального произведения. И вот у Nvidia новая разработка, которая и вовсе кажется магией: нейросеть научилась подбирать звук для беззвучных видео. 

#INSERT_ARTICLE#

Ученые из Университета Карнеги — Меллона с компанией Runway, разрабатывающей компьютерное программное обеспечение, представили технологию Soundify. Она способна подставлять подходящие звуки в видео, у которого отсутствует аудиодорожка. Над проектом работали Дэвид Чуан-Эн Лин, Анастасис Германидис, Инин Ши, Кристобаль Валенсуэла и Николас Мартеларо.   

Чтобы сопоставить звук с изображением, ученые использовали отдельные программы для анализа аудио и видео. Прежде всего, они разделили исходный ролик по кадрам, анализируя цветовую гистограмму между соседними изображениями. Однако этого было недостаточно, чтобы нейросеть под названием CLIP смогла подставить звук. Далее исследователи классифицировали звуки на две категории. К первой они отнесли объекты на видео, которые производят конкретные четкие звуки. Ученые назвали их «эффектами». К ним отнесли в том числе звонок велосипеда, щелчок камеры и звук клавиатуры. Во вторую же группу вошли фоновые шумы: например, звуки кафе, аэропорта или улицы. Для определения аудио использовали библиотеку звуков Epidemic Sound, в которой собрано более 90 тысяч шумов.

#INSERT_ARTICLE#

Но и на этом работа ученых не закончилась. Следующим шагом они пропустили изображение через нейросеть, которая сделала метки на каждом кадре. Таким образом нейросеть подобрала пять наиболее подходящих звуков для сцены. По задумке создателей, технология изначально предлагает подставить на видео конкретный звуковой эффект, который ей кажется наиболее удачным, но пользователь может самостоятельно поменять его на один из пяти предложенных вариантов. 

На последнем этапе алгоритм учитывает временные интервалы в видео, когда звук должен воспроизводиться, поскольку, как отметили в отчете ученые, объект может появляться и исчезать из кадра, удаляться и приближаться в видео. Несмотря на то, что технология уже хорошо развита, исследователям все еще есть к чему стремиться. К примеру, сейчас фоновый звук не получится настроить, если вдруг внезапно кадр леса сменится на городскую улицу. Так что, если изначально пользователь выбрал для изображения звук водопада, то нейросеть не додумается заменить его в следующем кадре с другой средой.

#INSERT_ARTICLE#

Подписывайтесь на наш Telegram-канал
Фото: Pexels
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Новости — 17:18, 29 апреля 2026
Восемь часов истерики. Группа Cream Soda — о новом альбоме, освобождении от перфекционизма и свете впереди
Новости, Новости — 29 апреля, 17:18
Ариана Гранде анонсировала альбом Petal
Новости, Новости — 29 апреля, 14:37
Смотрим трейлер фильма «Пока небо смотрит» с Валерией Гай Германикой
Новости, Новости — 29 апреля, 14:00
«Клуб Клуб» в Москве отмечает пять лет
Новости, Новости — 29 апреля, 13:11
Вышел тизер четвертого сезона «Теда Лассо»
Новости, Новости — 28 апреля, 21:35
Лора Дерн заменит Хелену Бонем Картер в четвертом сезоне «Белого лотоса»
Новости, Новости — 28 апреля, 20:00
Леди Гага и Doechii выпустили саундтрек к фильму «Дьявол носит Prada 2»
Новости — 28 апреля, 19:45
По следам 48-го Московского кинофестиваля: «Мосс и Фрейд», «Изгой», «Последний удар», «В тот день, когда она вернулась», «Драгоценные камни»
Новости, Новости — 28 апреля, 18:40
Valve подтвердила разработку Steam Deck 2
Новости, Новости — 28 апреля, 17:45
Бренд Birkenstock выпустил коллекцию лаков для ногтей
Новости, Новости — 28 апреля, 17:10
Комикс Квентина Тарантино «Джанго/Зорро» экранизируют
Новости, Новости — 28 апреля, 16:15
Хадсон Уильямс присоединился к касту триллера «Тиран»
Новости, Новости — 28 апреля, 15:15
Amazon MGM показала трейлер триллера «Истина» с Энн Хэтэуэй и Дакотой Джонсон
Новости, Новости — 28 апреля, 13:20
Фестиваль Signal переезжает на завод «Кристалл»
Новости, Новости — 27 апреля, 22:00
Клуб Powerhouse в Москве закрылся после 13 лет работы
Новости, Новости — 27 апреля, 21:05
Создатели «Гилти Гир» готовятся к новому этапу развития серии
Новости, Новости — 27 апреля, 19:00
Зумеры в России массово меняют офис на вахту
Новости, Новости — 27 апреля, 18:20
Мультсериал «Отель Хазбин» продлили на пятый сезон
Новости, Новости — 27 апреля, 17:55
Вышел трейлер четвертого сезона сериала «Звездный путь: Странные новые миры»
Новости, Новости — 27 апреля, 16:48
Том Харди возьмет паузу в карьере
Новости, Новости — 27 апреля, 14:25
HBO Max представил первые кадры спин-оффа «Теории большого взрыва»
Новости, Новости — 25 апреля, 14:01
Bad Bunny, Билли Айлиш и Arctic Monkeys: Spotify подвел итоги в честь своего 20-летия
Все звёзды и инфлюенсеры
Новости, Новости — 24 апреля, 19:00
«Кинопоиск» показал тизер драмеди «Седьмой игрок» с Антоном Лапенко
Новости, Новости — 24 апреля, 18:00
Фестиваль «Пикник „Афиши“ 2026» объявил вторую волну артистов
Новости, Новости — 24 апреля, 17:00
«В одном мы горшочке»: Антоха МС и Эльдар Джарахов выпустили песню «Цветочки»
Новости, Новости — 24 апреля, 16:45
Turbosh и «ШЫША» записали ироничный трек «ФИЗРУК»
Новости, Новости — 24 апреля, 16:00
У кей-поп-группы LE SSERAFIM вышел трек CELEBRATION
Новости, Новости — 24 апреля, 15:30
48-й Московский международный кинофестиваль объявил победителей
Новости, Новости — 24 апреля, 15:05
Dimka Batarin & ДАЙМОНД выпустили трек «все =»
Новости, Новости — 23 апреля, 19:05
О нападении на Ким Кардашьян в Париже снимут новый документальный сериал
Новости, Новости — 23 апреля, 17:14
«Чего же вы ждете»: вышел тизер фильма «Очень страшное кино — 6»
7.2
Сорвиголова: Рожденный заново
(2 сезон)
7.8
Прыгуны
7.8
Картины дружеских связей
5.2
Ван-Пис (2024)
(1 сезон)
8.2
Бриджертоны
(4 сезон)