Новости — 12 декабря 2021, 10:01

Нейросеть научилась определять звуки в беззвучных видео

Искусственный интеллект обладает множеством способностей. С одной стороны, стремительное развитие технологий может кого-то пугать, а с другой — это серьезно облегчает жизнь и двигает прогресс. Так, разработчики из Nvidia представили нейросеть, которая реалистично воссоздает человеческий голос, а еще через какое-то время слушатели впервые насладились законченной 10-й симфонией Бетховена. Все благодаря научному сотруднику из Федеральной политехнической школы Лозанны EPFL Флориану Коломбо, который смог воссоздать недостающий фрагмент музыкального произведения. И вот у Nvidia новая разработка, которая и вовсе кажется магией: нейросеть научилась подбирать звук для беззвучных видео. 

#INSERT_ARTICLE#

Ученые из Университета Карнеги — Меллона с компанией Runway, разрабатывающей компьютерное программное обеспечение, представили технологию Soundify. Она способна подставлять подходящие звуки в видео, у которого отсутствует аудиодорожка. Над проектом работали Дэвид Чуан-Эн Лин, Анастасис Германидис, Инин Ши, Кристобаль Валенсуэла и Николас Мартеларо.   

Чтобы сопоставить звук с изображением, ученые использовали отдельные программы для анализа аудио и видео. Прежде всего, они разделили исходный ролик по кадрам, анализируя цветовую гистограмму между соседними изображениями. Однако этого было недостаточно, чтобы нейросеть под названием CLIP смогла подставить звук. Далее исследователи классифицировали звуки на две категории. К первой они отнесли объекты на видео, которые производят конкретные четкие звуки. Ученые назвали их «эффектами». К ним отнесли в том числе звонок велосипеда, щелчок камеры и звук клавиатуры. Во вторую же группу вошли фоновые шумы: например, звуки кафе, аэропорта или улицы. Для определения аудио использовали библиотеку звуков Epidemic Sound, в которой собрано более 90 тысяч шумов.

#INSERT_ARTICLE#

Но и на этом работа ученых не закончилась. Следующим шагом они пропустили изображение через нейросеть, которая сделала метки на каждом кадре. Таким образом нейросеть подобрала пять наиболее подходящих звуков для сцены. По задумке создателей, технология изначально предлагает подставить на видео конкретный звуковой эффект, который ей кажется наиболее удачным, но пользователь может самостоятельно поменять его на один из пяти предложенных вариантов. 

На последнем этапе алгоритм учитывает временные интервалы в видео, когда звук должен воспроизводиться, поскольку, как отметили в отчете ученые, объект может появляться и исчезать из кадра, удаляться и приближаться в видео. Несмотря на то, что технология уже хорошо развита, исследователям все еще есть к чему стремиться. К примеру, сейчас фоновый звук не получится настроить, если вдруг внезапно кадр леса сменится на городскую улицу. Так что, если изначально пользователь выбрал для изображения звук водопада, то нейросеть не додумается заменить его в следующем кадре с другой средой.

#INSERT_ARTICLE#

Подписывайтесь на наш Telegram-канал
Фото: Pexels
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Новости — 21:16, 9 января 2026
Что смотреть на каникулах. «Горничная», «Поймать монстра», «Вечность» и кое-что еще
Новости, Новости — 9 января, 21:16
Warner Bros. выпустит чиби-аниме «Скуби-Ду! Гокко»
Новости, Новости — 9 января, 19:05
В Великобритании восстановят и откроют для публики дом детства Дэвида Боуи
Новости, Новости — 8 января, 19:57
Disney раскрыл каст игрового ремейка «Рапунцель: Запутанная история»
Новости, Новости — 8 января, 17:21
Музыкальный фестиваль Tomorrowland впервые пройдет в Таиланде в 2026 году
Новости, Новости — 7 января, 21:10
Рэпер 50 Cent станет продюсером тру-крайм-сериала о войнах уличных банд
Новости — 7 января, 19:30
Балкон, парижская улица и картотека психотерапевта. География кино в 2025 году
Новости, Новости — 7 января, 15:15
Netflix анонсировал документалку о завершении «Очень странных дел»
Новости, Новости — 7 января, 12:00
В клубе «16 Тонн» покажут иммерсивный спектакль «Щелкунчик. Свадьба»
Тесты — 26 мая 2025, 14:12
Новости, Новости — 6 января, 19:05
Metacritic составили рейтинг самых высокооцененных игр для ПК 2025 года
Новости, Новости — 6 января, 09:13
Новое место в Москве: веганский паста-бар Means на Мясницкой
Новости, Новости — 5 января, 19:30
Краткий пересказ и Liquid Glass: у Telegram вышло обновление
Новости, Новости — 5 января, 14:50
Смотрим тизер хоррора «На помощь!» с Рейчел Макадамс
Кино — 5 января, 12:47
«Бриджертоны», «Лакомый кусок», «Тайна семи циферблатов» и еще 2 проекта Netflix, которые надо ловить в январе
Кино — 4 января, 22:10
Ну, посмотрим. «Элла Маккей», «Злая. Часть 2», «Зверополис 2», «Эта штука работает?», «Мелодия их мечты», «Аргентинец»
Образ жизни — 3 января, 19:15
Пусть город знает, где они тусуют. Гид по нишевым вечеринкам и местам Москвы
Новости, Новости — 3 января, 10:40
Количество фильмов, снятых женщинами, упало до семилетнего минимума
Новости, Новости — 2 января, 16:35
KATSEYE выпустили новый сингл Internet Girl
Интервью — 2 января, 13:34
Диалоги о русском инди. Интервью с автором книги «Это было в России» Аркадием Романовым
Новости, Новости — 31 декабря 2025, 12:46
В БДТ покажут спектакль Романа Михайлова «Утренний предшественник»
Новости, Новости — 31 декабря 2025, 11:29
Forbes внес Бейонсе в список миллиардеров
Все звёзды и инфлюенсеры
Новости, Новости — 30 декабря 2025, 18:10
Появились новые серии российского аниме «Киберслав»
Новости, Новости — 30 декабря 2025, 17:10
Вышел музыкальный фильм «Голубой андеграунд 2026»
Новости, Новости — 30 декабря 2025, 16:25
«Зверополис-2» вошел в пятерку самых кассовых мультфильмов в истории
Новости, Новости — 30 декабря 2025, 15:40
Хидэаки Анно выпустит короткометражный фильм по Neon Genesis Evangelion
Новости, Новости — 30 декабря 2025, 14:30
MAPPA анонсировала продолжение бейсбольного аниме «Забвение бэттери»
Новости, Новости — 30 декабря 2025, 11:00
Издание NY Post составило рейтинг худших телевизионных проектов 2025 года
Новости, Новости — 29 декабря 2025, 19:45
ISSEY MIYAKE и ASICS выпустят совместные кроссовки
Новости, Новости — 29 декабря 2025, 17:30
Даниэль покинула группу NewJeans
Новости — 29 декабря 2025, 16:55
«Олдскул-2», Епифанцев и бесплатная нефть. Что PREMIER покажет в 2026 году
Эмили в Париже
(5 сезон)
Прощай, Джун
Человек против малыша
(2 сезон)
Покинутые
(1 сезон)
7.2
Добро пожаловать в Дерри
(1 сезон)
7.1
Очень странные дела
(5 сезон)