Теперь это подразделение корпорации, которое активно выпускает новые продукты и сейчас представило общественности свежий проект. DeepMind выпустила новую версию своей модели мира на базе искусственного интеллекта под названием Genie 3. Она способна генерировать трехмерные среды, с которыми пользователи ИИ могут взаимодействовать в режиме реального времени.
Объясняем, что это значит. Модель мира — это тип искусственного интеллекта, в рамках которого можно моделировать среду в образовательных и развлекательных целях, а также для обучения роботов или ИИ-агентов. Как это работает? Пользователь дает системе задачу, а она, в свою очередь, генерирует пространство, по которому можно перемещаться, как по миру видеоигры. Вот только здесь все создается не вручную из трехмерных объектов, а генерируется с помощью искусственного интеллекта.
По данным портала The Verge, Google вкладывает в это направление значительные усилия. Так, в декабре прошлого года компания представила Genie 2 — модель, способную создавать интерактивные миры на основе изображений. А сейчас в Google формируется команда по созданию моделей мира под руководством бывшего соруководителя Sora от OpenAI.
Все это выглядит очень перспективно, но пока у существующих моделей есть ряд недостатков. Например, миры Genie 2 можно было просматривать всего минуту. Следующая версия, Genie 3, может стать заметным шагом вперед. Говорят, пользователи могут создавать миры, которые поддерживают несколько минут непрерывного взаимодействия. А это уже значительно больше, чем 10 или 20 секунд взаимодействия, доступных в Genie 2. В Google заявляют, что Genie 3 может удерживать «пробелы в зрительной памяти» около минуты. Это значит, что модель будет запоминать местоположение объектов, когда вы отводите от них взгляд. Например, краска на стене или надпись на доске останутся на прежних местах, когда вы вновь на них взглянете. И, что еще приятно, миры будут иметь разрешение 720p и скорость 24 кадра в секунду.
Кроме того, в Genie 3 появились так называемые «события мира по запросу». Они позволяют изменять состояние виртуального мира через текстовые запросы. Так, с помощью подсказок можно, например, менять погодные условия или добавлять новых персонажей.
Однако, опробовать модель самостоятельно пока не представляется возможным. По данным Google, Genie 3 запускается в виде «ограниченной исследовательской версии», которая будет доступна небольшой группе ученых и разработчиков. Нужно это для того, чтобы разработчики смогли лучше понять риски и способы их снижения.