Новости — 5 апреля 2023, 16:06

«Яндекс» анонсировал «Шедеврум» — приложение для генерации изображений по текстовому запросу

Они способны генерировать качественные изображения на основе текстового описания. А потому с нейросетями не только играются, прося их нарисовать мемы или новые версии классических картин, но и полноценно сотрудничают. Так, DALL-E 2 уже успела создать обложку для журнала Cosmopolitan и представить концепт автомобиля от Apple, вдохновленного MacBook и Magic Mouse. Инструменту прекрасно удается все, кроме одного: распознавать описания на других языках. Решить эту проблему отважились в «Яндексе». 

Компания представила прототип собственной нейросети для генерации картинок по текстовым запросам «Шедеврум». Название говорящее: ИИ способен создавать реалистичные и фантастические картинки, максимально погружаясь в техзадание. Проверить, как «Шедеврум» сочетает несочетаемое и фантазирует, можно в бета-версии приложения, которая уже доступна на Android и iOS. 


«Шедеврум» — говорят в компании, полиглот: он понимает русский и английский языки. Но главная его черта — любовь к конкретике. Чем подробнее описание, тем точнее получается результат. Помимо базового задания, нейросеть способна учитывать особые пожелания. Например, может создать фотореалистичное изображение, если такое требуется. Кроме того, она может подражать известным художникам и работать в заданных художественных стилях.

По какому принципу работает «Шедеврум»? Нейросеть генерирует изображения по методу каскадной диффузии. Сначала она рисует картинки в соответствии с запросом, а затем поэтапно увеличивает их разрешение и добавляет детали. Первую версию генеративной модели разработчики обучали на 240 млн примеров картинок с текстовыми описаниями. Но так как пока запущена лишь бета-версия приложения, обучение продолжается. Сейчас «Шедевруму» показывают набор данных из 500 млн примеров. И это лишь начало: при следующих обновлениях качество будет постепенно улучшаться.


Первые шедевры «Шедеврума» можно изучить, скачав приложение. Там есть общая лента, в которой можно лайкать понравившиеся картинки. Самые популярные из них попадают в топ на отдельной вкладке. Чтобы сгенерировать собственное изображение, нужно оставить заявку. Но это временно: в дальнейшем играть с нейросетью смогут все зарегистрированные пользователи.

Среди работ «Шедеврума» — гусь-зомби, бобер, нарисованный в стиле Энди Уорхола, котейка в шубейке и робот-капибара. Когда состоится финальный релиз, программа будет способна генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и многое другое.

Фото: пресс-служба
Новости — 19:30, 25 июля
«Мы с тобой друг друга не узнали, мы не встретимся вновь»: слушаем сингл «Дорога домой» группы Beautiful Boys
Новости — 17:45, 25 июля
Коля Редькин и художник Gonya7 выпустили комикс о музыке 2010-х «Нужна только искра!»
Новости — 16:10, 25 июля
Начались съемки сериала «Время Счастливых» с Тихоном Жизневским и Ольгой Лерман
Новости — 15:00, 25 июля
По книге Гоголя «Вечера на хуторе близ Диканьки» выйдет аудиосериал с Милой Ершовой и Львом Зулькарнаевым
Новости — 13:00, 25 июля
Mirèle выпустила альбом «Тревожный тип привязанности». На фитах ЛСП, Слава КПСС и Бонд с кнопкой