Новости — 12 декабря 2021, 10:01

Нейросеть научилась определять звуки в беззвучных видео

Искусственный интеллект обладает множеством способностей. С одной стороны, стремительное развитие технологий может кого-то пугать, а с другой — это серьезно облегчает жизнь и двигает прогресс. Так, разработчики из Nvidia представили нейросеть, которая реалистично воссоздает человеческий голос, а еще через какое-то время слушатели впервые насладились законченной 10-й симфонией Бетховена. Все благодаря научному сотруднику из Федеральной политехнической школы Лозанны EPFL Флориану Коломбо, который смог воссоздать недостающий фрагмент музыкального произведения. И вот у Nvidia новая разработка, которая и вовсе кажется магией: нейросеть научилась подбирать звук для беззвучных видео. 

#INSERT_ARTICLE#

Ученые из Университета Карнеги — Меллона с компанией Runway, разрабатывающей компьютерное программное обеспечение, представили технологию Soundify. Она способна подставлять подходящие звуки в видео, у которого отсутствует аудиодорожка. Над проектом работали Дэвид Чуан-Эн Лин, Анастасис Германидис, Инин Ши, Кристобаль Валенсуэла и Николас Мартеларо.   

Чтобы сопоставить звук с изображением, ученые использовали отдельные программы для анализа аудио и видео. Прежде всего, они разделили исходный ролик по кадрам, анализируя цветовую гистограмму между соседними изображениями. Однако этого было недостаточно, чтобы нейросеть под названием CLIP смогла подставить звук. Далее исследователи классифицировали звуки на две категории. К первой они отнесли объекты на видео, которые производят конкретные четкие звуки. Ученые назвали их «эффектами». К ним отнесли в том числе звонок велосипеда, щелчок камеры и звук клавиатуры. Во вторую же группу вошли фоновые шумы: например, звуки кафе, аэропорта или улицы. Для определения аудио использовали библиотеку звуков Epidemic Sound, в которой собрано более 90 тысяч шумов.

Но и на этом работа ученых не закончилась. Следующим шагом они пропустили изображение через нейросеть, которая сделала метки на каждом кадре. Таким образом нейросеть подобрала пять наиболее подходящих звуков для сцены. По задумке создателей, технология изначально предлагает подставить на видео конкретный звуковой эффект, который ей кажется наиболее удачным, но пользователь может самостоятельно поменять его на один из пяти предложенных вариантов. 

На последнем этапе алгоритм учитывает временные интервалы в видео, когда звук должен воспроизводиться, поскольку, как отметили в отчете ученые, объект может появляться и исчезать из кадра, удаляться и приближаться в видео. Несмотря на то, что технология уже хорошо развита, исследователям все еще есть к чему стремиться. К примеру, сейчас фоновый звук не получится настроить, если вдруг внезапно кадр леса сменится на городскую улицу. Так что, если изначально пользователь выбрал для изображения звук водопада, то нейросеть не додумается заменить его в следующем кадре с другой средой.

#INSERT_ARTICLE#

Подписывайтесь на наш Telegram-канал
Фото: Pexels
* Деятельность компании Meta Platforms Inc. (Facebook и Instagram) на территории РФ запрещена
** Признан иноагентом на территории РФ
Читайте также
Образ жизни — 19:30, 25 июля 2025
Архитектор человеческих эмоций. Художница Дарья Ивашкина — об арт-объекте для «Архстояния», черной дыре Никола-Ленивецкого уезда и стремлении «жить максимально увлекательную жизнь»
Новости, Новости — 25 июля, 19:30
«Мы с тобой друг друга не узнали, мы не встретимся вновь»: слушаем сингл «Дорога домой» группы Beautiful Boys
Новости, Новости — 25 июля, 17:45
Коля Редькин и художник Gonya7 выпустили комикс о музыке 2010-х «Нужна только искра!»
Новости, Новости — 9 июля, 16:03
В России пройдет федеральный чемпионат по танцу FAME TO FLAME
Новости, Новости — 25 июля, 16:10
Начались съемки сериала «Время Счастливых» с Тихоном Жизневским и Ольгой Лерман
Новости, Новости — 25 июля, 15:00
По книге Гоголя «Вечера на хуторе близ Диканьки» выйдет аудиосериал с Милой Ершовой и Львом Зулькарнаевым
Новости, Новости — 25 июля, 13:00
Mirèle выпустила альбом «Тревожный тип привязанности». На фитах ЛСП, Слава КПСС и Бонд с кнопкой
Новости, Новости — 24 июля, 18:30
Ханс Циммер напишет саундтрек для третьего сезона «Эйфории»
Кино — 24 июля, 17:25
Все не так, и все не то. 5 комедий о сомнительных решениях и их последствиях
Новости, Новости — 24 июля, 15:50
Стартовали съемки сериала «Полдень» по роману братьев Стругацких
Новости, Новости — 24 июля, 14:15
Объявлена программа 82-го Венецианского кинофестиваля
Новости, Новости — 23 июля, 18:40
Танцуют все: Tyler, the Creator выпустил новый альбом Don’t Tap the Glass. Основная идея — никакого сидения на месте
Новости, Новости — 23 июля, 15:40
Все серии нового сезона «Футурамы» дропнут в один день
Новости, Новости — 23 июля, 13:10
To be or not to be coldplayed: как «камера поцелуев» породила кучу мемов
Музыка — 23 июля, 12:02
Толкаю саунд, hip-hop soul. SRSLY-анкета SKY RAE
Новости, Новости — 23 июля, 11:41
Джордж МакКей, Фиона Шоу и Катрина Балф присоединились к касту новой экранизации «Разума и чувств»
Новости, Новости — 22 июля, 19:30
По The Sims вышла настольная игра
Новости, Новости — 22 июля, 17:50
«Америкашка Дэни» оценит русские свадьбы в новом реалити на «Субботе!»
Новости, Новости — 22 июля, 15:35
«Вкусно — и точка» выпустили специальное меню с Hello Kitty
Музыка — 22 июля, 15:04
Камерные эфиры и большая сцена, коллекция пластинок и рейв-культура. 7 вопросов Errortica
Новости, Новости — 22 июля, 14:00
Билли Айлиш и Джеймс Кэмерон работают над совместным проектом
Новости, Новости — 22 июля, 12:50
Начало съемок, первые кадры с площадки и пополнение каста: что известно о сериале по «Гарри Поттеру»
Все звёзды и инфлюенсеры
Новости, Новости — 22 июля, 11:58
«Спроси, почему так с дороги пути устал»: лампабикт выпустил сингл «уши»
Новости, Новости — 21 июля, 19:07
Блестящая коллаборация: Swarovski и Minecraft выпустили совместный мерч
Новости, Новости — 21 июля, 17:06
«Я смотрю в твои глаза, и мир стал на тон светлее»: Basic Boy и Joseph релизнули совместный сингл
Кино — 21 июля, 14:30
Коллективный сон. Олег Чугунов — о работе с Романом Михайловым, магическом реализме и ответственности рассказчика
Новости, Новости — 21 июля, 13:55
«Все останется в музыке»: вышел новый трек Тоси Чайкиной
Новости, Новости — 21 июля, 11:13
«Где правила, по которым ты играл со мной?»: «внимание брусника!» дропнула новый трек
Новости, Новости — 20 июля, 12:30
«Переходный возраст» и «Игра в кальмара»: Netflix объявил самые популярные проекты 2025-го
Новости, Новости — 19 июля, 17:33
Венецианский кинофестиваль объявил состав жюри
Новости, Новости — 19 июля, 14:00
Тайка Вайтити снимет новый фильм про Судью Дредда
Не одна дома 2
Бриджит Джонс: Без ума от мальчишки
8.1
Смерть единорога
5.1
Обезьяна
4.2
Денискины рассказы
(1 сезон)
8.3
Белый лотос
(3 сезон)
7.7
Микки-17
7.5
Кончится лето