Новости — 5 апреля 2023, 16:06

«Яндекс» анонсировал «Шедеврум» — приложение для генерации изображений по текстовому запросу

Они способны генерировать качественные изображения на основе текстового описания. А потому с нейросетями не только играются, прося их нарисовать мемы или новые версии классических картин, но и полноценно сотрудничают. Так, DALL-E 2 уже успела создать обложку для журнала Cosmopolitan и представить концепт автомобиля от Apple, вдохновленного MacBook и Magic Mouse. Инструменту прекрасно удается все, кроме одного: распознавать описания на других языках. Решить эту проблему отважились в «Яндексе». 

Компания представила прототип собственной нейросети для генерации картинок по текстовым запросам «Шедеврум». Название говорящее: ИИ способен создавать реалистичные и фантастические картинки, максимально погружаясь в техзадание. Проверить, как «Шедеврум» сочетает несочетаемое и фантазирует, можно в бета-версии приложения, которая уже доступна на Android и iOS. 


«Шедеврум» — говорят в компании, полиглот: он понимает русский и английский языки. Но главная его черта — любовь к конкретике. Чем подробнее описание, тем точнее получается результат. Помимо базового задания, нейросеть способна учитывать особые пожелания. Например, может создать фотореалистичное изображение, если такое требуется. Кроме того, она может подражать известным художникам и работать в заданных художественных стилях.

По какому принципу работает «Шедеврум»? Нейросеть генерирует изображения по методу каскадной диффузии. Сначала она рисует картинки в соответствии с запросом, а затем поэтапно увеличивает их разрешение и добавляет детали. Первую версию генеративной модели разработчики обучали на 240 млн примеров картинок с текстовыми описаниями. Но так как пока запущена лишь бета-версия приложения, обучение продолжается. Сейчас «Шедевруму» показывают набор данных из 500 млн примеров. И это лишь начало: при следующих обновлениях качество будет постепенно улучшаться.


Первые шедевры «Шедеврума» можно изучить, скачав приложение. Там есть общая лента, в которой можно лайкать понравившиеся картинки. Самые популярные из них попадают в топ на отдельной вкладке. Чтобы сгенерировать собственное изображение, нужно оставить заявку. Но это временно: в дальнейшем играть с нейросетью смогут все зарегистрированные пользователи.

Среди работ «Шедеврума» — гусь-зомби, бобер, нарисованный в стиле Энди Уорхола, котейка в шубейке и робот-капибара. Когда состоится финальный релиз, программа будет способна генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и многое другое.

Фото: пресс-служба
Образ жизни — 12:21, 23 ноября
Что бы посмотреть? «Контакты. Игра», «Читатели» и другие новые шоу
Новости — 16:05, 22 ноября
Стивен Кинг анонсировал новую книгу — в ней вернется Холли Гибни
Новости — 13:40, 22 ноября
Новый роман по «Ведьмаку» будет про юного Геральта
Кино — 13:10, 22 ноября
«Сердце должно гореть у всех». Олег Савостюк — о сериале «Дайте шоу», парадоксальности страхов и воспитании внутреннего критика
Новости — 11:31, 22 ноября
Электроника и этно-мотивы: дуэт LAVBLAST выпустил второй альбом More