Видео от нейросети Sora, которыми поделилась компания OpenAI, ничего, кроме восторга, не вызывают. Сам факт того, что искусственный интеллект может создать видеоролик, основываясь только лишь на текстовом запросе, заставляет усомниться в том, что это реальность, а не сюжет научно-фантастического фильма.
Что же умеет Sora? Во-первых, анимировать сложные сцены с несколькими персонажами с разными моделями поведения, при этом — четко воссоздавать детализированный фон. Нейросеть, как заявляет OpenAl, обладает глубоким пониманием языка, а потому она может точно интерпретировать подсказки и генерировать убедительных персонажей с весьма естественными эмоциями, например, изображать задумчивость, как в ролике, где текстовым запросом был «молодой человек в возрасте 20 лет сидит на облаке в небе и читает книгу», или недовольство (в видео про то, как кошка разбудила своего спящего хозяина, требуя завтрака). Sora также может генерировать воображаемых существ — разных монстров, которые выглядят весьма умилительно (того, что играет со свечкой или того, который гуляет по сказочному лесу).
Во-вторых, Sora может воссоздавать реально существующие места: побережье Амальфи, снятое с дрона, город Лагос 2056 года в Нигерии или даже показать исторические кадры Калифорнии во время золотой лихорадки. Отдельно стоит отметить, что картинка сгенерированных видео отнюдь не статична — виртуальной съемке могут позавидовать многие режиссеры Голливуда.
Конечно, нейросеть несовершенна и имеет слабые стороны, в этом OpenAl признается весьма честно. Sora может неверно интерпретировать физику сложной сцены и неправильно понять причинно-следственную связь, из-за чего генерируются забавные, но порой ужасающие видео: мужчина на беговой дорожке развернут в другую сторону, щенки появляются друг из друга, стул начинает парить в воздухе, а свечи не гаснут от дуновения.
Видеоролики, безусловно, выглядят впечатляюще, однако возникает некоторое опасение за безопасность, в эпоху дипфейков особенно. По словам представителей OpenAl, нейросеть будет отклонять все запросы, в которых упоминаются знаменитости, чтобы не распространять ложные, но реалистичные видео. Помимо этого, Sora не будет отвечать на запросы, связанные с насилием и ненавистью. В данный момент нейросеть находится на стадии тестирование и недоступна широкой аудитории.