DALL-E 2 vs MidJourney: наш опыт практического применения нейросети для оформления сайта…и не только

Привет, Хабр! В этом посте я расскажу том, как мы на практике применили результат работы нейросети, почему решили использовать ИИ для отрисовки графики на сайте и предлагаю обсудить, какие вообще существуют перспективы в этой сфере для российского бизнеса. Под катом — наша история выбора и применения нейросети, а также несколько сгенерированных разными нейросетями наборов картинок с запросами, по которым мы их получили. 

ad85eb1be2804326fa82896e1e51f2f9.jpeg

Меня зовут Артём Попов, я — руководитель отдела маркетинга в интернет-магазине xcom-shop, и сегодняшний пост отражает отношение потребителя или, если хотите, заказчика графики. У дизайнеров постоянно не хватает времени на то, чтобы выполнять запросы всех бизнес-юнитов, а нам постоянно хочется чего-то этакого… Может, заказать отрисовку нейросети?

Раньше никто и не задумался бы о таком решении, но сейчас тема явно находится в зоне хайпа: про нейросети не слышал только ленивый. На прошлой неделе вышел лонгрид о возможностях нейросетей, позже мы всем рунетом ужасались реалистичностью «последнего селфи на Земле», сделанного «руками» DALL-E 2. А благодаря тому, что редакция портала 72.ru поэкспериментировала со словами запросов, жители Тюмени (и все, кто неравнодушен к Тюмени) смогли взглянуть на свой родной край «глазами» нейросети MidJorney — результаты можно посмотреть тут.

Какую нейросеть выбрать?

Признаюсь честно, мы тоже все это читали и смотрели. И даже вдохновились качеством и глубиной сгенерированных картинок. После этого оказалось просто невозможно пройти мимо (мы ведь работаем в сегменте высоких технологий и должны идти в ногу со временем). А значит, мы в xcom-shop просто обязаны попробовать работу с нейросетью. 

Так начался выбор оптимального для нас решения. В фокусе оказались две наиболее раскрученные на данный момент системы. Ниже я постарался свести в единую таблицу их характеристики/плюсы/минусы:

Нейросеть

DALL-E 2

MidJourney

Разработчик

OpenAI

MidJourney (независимая группа разработчиков)

Дата запуска, текущий статус

20 июля 2022 (закрытый бета-тест) 

13 июля 2022 (открытый бета-тест)

Максимальный размер изображения

PNG, до 1024×1024 пикселей

JPG, до 1664×1664 (или другой до 3 миллионов пикселей)

Возможность менять масштаб

нет

да, можно задавать пользовательский размер изображения

Доступ

API (причем доступ из РФ закрыт)…тоже мне OPEN

Discord

Права на использование в коммерческих целях

Полные права на все сгенерированные изображения

По подписке (для компаний с оборотом от $1 млн. в год стоит $600)

Бесплатный лимит, стоимость

50 запросов в месяц, далее 115 запросов за $15

25 запросов бесплатно,  

далее по подписке

Субъективная оценка удобства работы с запросами

Нейросеть более чутко схватывает суть сложных запросов

Очень хорошие изображения даже по простым запросам

Субъективная оценка качества изображений на выходе

Удовлетворительный уровень качества и детализации итогового изображения.

Высокий уровень качества и детализации итогового изображения.

Но я практически уверен, что моя субъективная оценка вас не убедила. :) Делюсь изображениями, которые мы получили в ходе тестирования нейросетей по одним и тем же запросам:

74d927fb951faff3ae67e43b5914645b.jpeg52fdae3f6c8e3b825ea3970be0a7347b.jpeg

Несмотря на то, что DALL-E 2, кажется, более тонко схватывает все нюансы запросов и, по моим ощущениям, дает более релевантные сложным текстам картинки, наш выбор все-таки пал на Midjourney. И на то несколько причин.

Главная — мы всем коллективом очарованы тем, как MidJourney видит наш xcom-shop в будущем.

c70f9890904ba13cbefda2e03ea2e714.jpeg

Во вторых, этот вариант реально доступен для бизнеса без заморочек с VPN и правами на коммерческое использование. Заплатив $600 (714 с учетом налога) за корпоративный тарифный план, мы тут же отправились тестировать алгоритмы AI. Это, кстати, очень увлекательно, и в первый вечер я пересидел на работе 3 часа сверх нормы, играясь с веселыми картинками…зато ехал домой без пробок. ;)

Интересный факт, мы первые? Да!

«Автор, ты о чем?» — скажете вы. — «Уже многие компании использовали нейросеть для генерации изображений.» И будете правы!  

Например,   Cosmopolitan заказал обложку алгоритму DALL-E 2 — получилось очень даже неплохо. А ранее The Economist использовал ИИ-бота для создания обложки тематического номера о современных цифровых технологиях. И не забывайте про «особого дизайнера» студии Лебедева, Николая Иронова, который уже больше года выполняет самые разные работы для заказчиков.

Но все они не интернет-магазины! И, судя по всему, мы — первый интернет-магазин в России, реально применяющий нейросеть на своем сайте. И не просто один раз разместив какой-то элемент, а на постоянной основе (само собой, мы ж подписку на год оплатили).

Решение практических задач

Что касается задач, мы решили не придумывать каких-то специальных выкрутасов для нейросети — я наигрался с ними в первый же вечер. Вместо этого мы сфокусировались на своих текущих потребностях. А именно — «подсветке» на сайте недавно выпущенного подборщика блоков питания.

Вообще это обычная практика — мы размещаем баннеры на главной и в соответствующем разделе каталога. Вот именно их создание мы и поручили нейросети.

На баннере нужно было показать креатив, связанный с блоками питания ПК, мощностью и энергией (сервис подбирает оптимальный БП под конфигурацию системного блока). Имея эти образы в голове, мы с дизайнером Ярославом Шиловым начали перебирать запросы для нейросети.

Вот несколько наших запросов и полученный для них результат:

7771a57954a938031fd3fe06a65ac605.jpeg

На каждый запрос нейросеть представляет четыре варианта изображения на выбор. Это оказалось очень удобно: можно сразу сделать выбор и на основе понравившегося варианта получить ещё четыре скетча. А если какой-то вариант устраивает, можно улучшить его в качестве (сделать апскейл разрешения).

В запросах к Midjourney можно дополнительно указывать разрешение итоговых изображений, преимущественные цвета, художественный стиль и многое другое.

4f1702d90baf9ca7e1e727586bddd6c2.jpeg

В поисках необходимого изображения было сделано более 30 запросов. Иногда нейросеть выдавала совсем неподходящие варианты, возможно из-за нехватки с нашей стороны опыта в написании запросов. Так что для планомерной работы (но крайней мере нам сейчас) нужен большой запас запросов. Но в итоге, уловив правильное направление, нам  удалось прийти к желаемому результату. 

e86a9dce3c13247d1450ec169ca279ab.jpeg

На первом же опыте мы убедились в том, что нейросеть может ускорить рабочий процесс дизайнера. Обычно специалист тратит много времени на поиск идеи, графические ресурсы в открытом доступе и прочий креатив. Мы же в итоге решили эту задачу вдвое быстрее. Ну и, конечно, дизайнер получает уникальные материалы для дальнейшей работы, и ее результат будет отличаться от всего, что есть в сети. 

Да, в подборках встречалась какая-то ерунда. Но, проработав несколько запросов, волшебным образом мы получили то самое изображение, подходящее под нашу тематику.

e733d3301979d0193a9c593ab61da08b.jpeg

Несколько доработок, добавляем текст, адаптируем под нужное разрешение — и вуаля! Картинка для баннера готова. И баннер уже красуется на нашем сайте.

f2c8f47f37a5e9fdcde862fbee041826.jpeg

Нейросеть — вдохновитель дизайнера

Помимо графики, которую дизайнер сможет использовать в своей работе, нейросеть обладает еще одним удивительным свойством, а именно — генерирует идеи. Для любого творческого специалиста это отличное подспорье. И мой коллега, дизайнер Ярослав Шилов подтвердил, что это именно так. 

В процессе работы с AI сложно не заметить, что некоторые изображения действительно бьют «прямо в точку»! Невольно задаешься вопросом — как раньше мне это не пришло в голову? Так что нейросеть совершенно точно можно использовать как бесконечный источник мыслей для вдохновения.

Дальше — больше

Итак, мы получили вполне себе положительные результаты эксперимента по использованию сгенерированных нейросетью изображений на нашем сайте и готовы идти дальше и масштабировать полученный результат. 

Однозначно, мы будем применять технологию для подготовки email-рассылок (следующую нашу еженедельную рассылку мы полностью составим из сгенерированных изображений, подписывайтесь).

Также будем генерировать визуалы наших постов в соцсетях исключительно через нейросеть. Весь август вести группы xcom-shop нам будет помогать робот. И для знатоков работы нейросетей мы приготовили забавный конкурс: Первый, кто угадает запрос, по которому мы сгенерировали изображение для поста — получит 1000 баллов на свой бонусный счёт, все подробности у нас в телеграм, ВК и Яндекс.Дзен.

1c8c6e8bd2f6bcee78e5fe1987bd3af4.png

Выводы

Конечно, пока рано говорить, что нейросеть способна полностью заменить дизайнера. Но уже сейчас искусственный интеллект может упростить работу специалиста, ответственного за подготовку графики. Ведь на отрисовку иллюстрации обычно и уходит большая часть времени дизайнера, а с этой задачей нейросеть уже сейчас справляется если не отлично, то уверенно хорошо. Важно только найти правильный подход и научиться формулировать запросы.

С другой стороны, пока роботу непосильны как минимум такие стандартные дизайнерские задачи, как набор текста, работа по брендбуку и правильное размещение логотипов. И тут как раз выручает дизайнер, который уже адаптирует сгенерированные AI изображения для решения вполне конкретных бизнес-задач. 

Возможно, скоро мы увидим в резюме дизайнеров в дополнение к привычной креативности, многозадачности и стрессоустойчивости (ну или виртуозного владения графическим пакетом Adobe/Corel) приписку вроде «уверенно ставлю задачи нейросети». И как знать, может быть именно это станет конкурентным преимуществом при приеме на работу. 

А вы что думаете про результаты нашей работы с нейросетью? Делитесь в комментариях, давайте обсудим!

© Habrahabr.ru