Новости — 17 февраля 2024, 15:27

OpenAI запустила нейросеть Sora. Она генерирует видео по текстовому запросу

Видео от нейросети Sora, которыми поделилась компания OpenAI, ничего, кроме восторга, не вызывают. Сам факт того, что искусственный интеллект может создать видеоролик, основываясь только лишь на текстовом запросе, заставляет усомниться в том, что это реальность, а не сюжет научно-фантастического фильма.

Что же умеет Sora? Во-первых, анимировать сложные сцены с несколькими персонажами с разными моделями поведения, при этом — четко воссоздавать детализированный фон. Нейросеть, как заявляет OpenAl, обладает глубоким пониманием языка, а потому она может точно интерпретировать подсказки и генерировать убедительных персонажей с весьма естественными эмоциями, например, изображать задумчивость, как в ролике, где текстовым запросом был «‎молодой человек в возрасте 20 лет сидит на облаке в небе и читает книгу»‎, или недовольство (в видео про то, как кошка разбудила своего спящего хозяина, требуя завтрака). Sora также может генерировать воображаемых существ — разных монстров, которые выглядят весьма умилительно (того, что играет со свечкой или того, который гуляет по сказочному лесу).


Во-вторых, Sora может воссоздавать реально существующие места: побережье Амальфи, снятое с дрона, город Лагос 2056 года в Нигерии или даже показать исторические кадры Калифорнии во время золотой лихорадки. Отдельно стоит отметить, что картинка сгенерированных видео отнюдь не статична — виртуальной съемке могут позавидовать многие режиссеры Голливуда.

Конечно, нейросеть несовершенна и имеет слабые стороны, в этом OpenAl признается весьма честно. Sora может неверно интерпретировать физику сложной сцены и неправильно понять причинно-следственную связь, из-за чего генерируются забавные, но порой ужасающие видео: мужчина на беговой дорожке развернут в другую сторону, щенки появляются друг из друга, стул начинает парить в воздухе, а свечи не гаснут от дуновения.

Видеоролики, безусловно, выглядят впечатляюще, однако возникает некоторое опасение за безопасность, в эпоху дипфейков особенно. По словам представителей OpenAl, нейросеть будет отклонять все запросы, в которых упоминаются знаменитости, чтобы не распространять ложные, но реалистичные видео. Помимо этого, Sora не будет отвечать на запросы, связанные с насилием и ненавистью. В данный момент нейросеть находится на стадии тестирование и недоступна широкой аудитории. 

Фото: кадр из мультфильма «Город героев»
Образ жизни — 12:21, 23 ноября
Что бы посмотреть? «Контакты. Игра», «Читатели» и другие новые шоу
Новости — 16:05, 22 ноября
Стивен Кинг анонсировал новую книгу — в ней вернется Холли Гибни
Новости — 13:40, 22 ноября
Новый роман по «Ведьмаку» будет про юного Геральта
Кино — 13:10, 22 ноября
«Сердце должно гореть у всех». Олег Савостюк — о сериале «Дайте шоу», парадоксальности страхов и воспитании внутреннего критика
Новости — 11:31, 22 ноября
Электроника и этно-мотивы: дуэт LAVBLAST выпустил второй альбом More