10 приёмов чтобы получить быструю и качественную картинку в Midjourney

Меня зовут Андрей Цыган — я предприниматель, управленец и как энтузиаст исследую возможности нейросетей. Я никогда не работал ни с графическими редакторами, ни даже с PhotoShop -, но постоянно нуждался в таких услугах. Качественные изображения мне были нужны для презентаций, маркетинговых материалов, соц. сетей.

Из всех сетей генерации изображений мне больше всего понравился Midjourney — оптимальное качество на потраченное время. Я понимаю в самом Midjourney (не говоря про Stabble Diffusion) можно углубиться в детали -, но я не дизайнер или AI artist, мои задачи прикладные.

У меня уже сгенерированно более 4000 изображений и я выделил 10 методов, которые позволяют достаточно быстро и качественно получить нужный мне контент.  Они могут использоваться как обложка к посту или лонгриду, или я чаще использую в презентации. Я хорошо помню ту боль и страдания поиска нужной картинки, в достойном качестве, нужных пропорций чтобы подчеркнуть мысль. Иногда на это уходило времени больше, чем на текст и буллеты презентации. Вот пример какие сейчас у меня, без дизайнера, получаются презентации:

Все изображения генерирую в Midjourney

Все изображения генерирую в Midjourney

Это конечно не варианты для выставки работ, создания нейрокартины, элемента брендинга -, но предпринимателям не всегда нужен такой перфекционизм.

1. Начинаем с простого промта

Всё гениальное — просто) Сам Midjourney пишет — не усложняйте. Промты размером в томик «Войны и Мир» он полностью не читает.

Важно помнить — что мы должны описывать не процесс, чувства персонажей -, а описывать конечную картину. Представьте что она у вас есть — и просто опишите её. Для начала я всегда начинаю с этого метода, в 70% я получаю результат и пошёл дальше.

Товарищ Midjourney понимает только английский язык, поэтому, если с ним «на Вы» — идём в Deepl. Посмотрим пример — мне в подводке нужно было рассказать про карго-культ и нужны атмосферные картинки

A photo of the very surprised natives of the island of Vanuatu

A photo of the very surprised natives of the island of Vanuatu

Что можно ещё добавить:

  • Соотношения сторон. Понимая применение картинки мы будем знать размер. Midjourney оперирует не пикселями, а соотношением. Если нужно перевести, можно использовать калькулятор. К примеру, слайд — 16:9, сторис — 9:16, пост в инстаграм — 1:1. Когда делаю презентацию, я сначала прописываю текст, а потом «на глаз» сколько осталось места. В Midjourney это задаётся параметром --ar 16:9 (вставить свои цифры)

Весь слайд 16:9. Мне нужна картинка занимающая пример треть по ширине,и полную высоту. В таком случае я ставлю 5:9 или 6:9

Весь слайд 16:9. Мне нужна картинка занимающая пример треть по ширине, и полную высоту. В таком случае я ставлю 5:9 или 6:9

  • Фон и цвета. Перед началом презентации я понимаю, какой буду использовать фон и основной цвет, очень классно смотрятся картинки которые сочетаются с цветами заголовка.И тогда добавляем после нашего промта цвет фона и цвет линий: белый фон и оранжевые цвета/чёрный фон и красные цвета

    Совсем несложно, на слайд лучше смотрится когда и люди и заголовок в одном цвете

    Совсем несложно, на слайд лучше смотрится когда и люди и заголовок в одном цвете

  • Требуется именно фото. Иногда по простому описанию MJ может делать иллюстрации. Есть множество способов намекнуть MJ что мы хотим именно фото — я использую в начале промта Photo of «ваш запрос». Ниже пример один и тот же запрос — иллюстрация и фото

    f70069ae46dd27c6cf54d5f8978a223f.jpg
  • Используем разные версии. В MJ сейчас порядка 10 рабочих версий, и номер версии не значит что она именно хуже — она рисует по другому. И иногда даже более старые версии могут рисовать лучше.Для этого используем функцию «перебора» и вставляем такую конструкцию. Предварительно отключите в настройках «style raw» .

--v {4 {--style {4a, 4b, 4c}}, 5{a, b,.1,.1 --style raw,.2,.2 --style raw}}

Мы получаем сразу 9 генераций по одному промту в разных стилях. Иногда в предыдущих версиях может быть более интересный результат.

91458b372941ab08fa1d5929bef239a2.png

2. Изменяем странность картинки

В версии 5.2 был добавлен новый параметр--weird — странность картинки. Если полученные изображения вам показались очень скучные, можно применить его. Значение варьируется от 0 до 1000. Можно сделать мультипромт и сразу указать 4 значения. Хорошо работает на абстрактных образах:

brain with neural network and chips white background,orange colors --w {0,250,500,1000}

Верхний ряд: 0, 250. Нижний ряд: 500,1000

Верхний ряд: 0, 250. Нижний ряд: 500,1000

3. Используем Zoom

Одно из дополнений в версии 5.2 — возможность дорисовки изображения. Midjourney отдаляет объект и дорисовывает картину рядом.
Можно нажать просто Zoom — тогда будет использован ваш первоначальный промт, если нажать Custom Zoom — то можно внести дополнения, что вы хотите видеть

Изображения можно зумировать несколько раз

Изображения можно зумировать несколько раз

Если задумка изображения вам понравилась, то можно попытаться дорисовать. Вот что получить при Zoom 2x

Вполне интересные картины с аналогией дерева

Вполне интересные картины с аналогией дерева

4. Используем дорисовку по сторонам

Midjourney в целом неплохо рисует центральный объект, но появляются трудности когда нам нужна композиция — несколько детальных объектов в изображении. У нас появляются «стрелочки» которыми мы указываем в какой области лучше дорисовать изображение. Так можно сделать и панорамные изображения.

Внизу стрелочки показывают направление дорисовки

Внизу стрелочки показывают направление дорисовки

Дорисуем наше изображение:

2 раза применена дорисовка

2 раза применена дорисовка

4 раза применил дорисовку

4 раза применил дорисовку

Это хороший способ когда нужно сделать изображение с несколькими сценами. Промт, к сожалению, менять нельзя, поэтому полагаемся на хорошее настроение Midjourney

5. Используем рефе

Если первые способы нас не удовлетворили во всех вариациях, или вы видите что совсем не в ту сторону думает MJ — есть способ направить его на путь истинный — показать фото или картинку как мы хотим.

Я хотел получить тех самых бабушек возле подъезда. Но по простому промту MJ мне выдавал их возле деревенского домика (по его мнению все бабушки в СССР жили только в избе)

6f3e7e3e15e8a9ddd3149884fb7eaac1.png

Но есть простой способ — находим в интернете картинку-образ, благо по запросу «бабушки возле подъезда» мы получаем обилие ностальгических снимков. Далее копируем URL на неё и вставляем в начало промта (это важно, картинка должна идти первой). Получается так:

https://s.mj.run/qkbMDN9l_Ek Russian grandmothers near the Soviet entrance hall

Многое будет зависеть от вашей картинки: позы, цвета, количество людей

Многое будет зависеть от вашей картинки: позы, цвета, количество людей

Так можно обходить и некоторые темы с национальностями, их MJ не любит, только через референс я смог сделать цыган с медведями в танце.

6. Распознание изображений

Уже достаточно давно по меркам нейросетей MJ ввёл функцию /describe — по ней он даёт 4 промта, как он увидел то, что на картинке.

Полезная функция когда вы понимаете образ, который легко найти в интернете. Я этот метод часто использую когда нужно нарисовать здание, улицы, город и т.д.

Современное офисное здание

Современное офисное здание

И у нас есть отличная новая кнопка «Imagine all» — мы сразу получаем генерации по всем промтам — 4×4 изображений. Он не сможет нарисовать по описанию 1в1, но образ и стилистика часто будут сохранены, плюс он будет добавлять немного новизны, иногда его изменения очень полезны.

Вот такой набор у нас получился после распознания и генерации всех образов

Вот такой набор у нас получился после распознания и генерации всех образов

7. Просим помощи у ChatGPT

Промт — это текст, текст — это ChatGPT. В целом логика такая)
ChatGPT не знает всех тонкостей и новых функций MJ, но он полезен чтобы описать сцену достаточно подробно. Вот он то пишет те самые длиииииинные промты.

Есть несколько методов написания промтов через ChatGPT — длинный и более верный, и короткий — когда время важнее художественности

  • Длинный. Так как ChatGPT не знает тонкостей MJ мы должны его дообучить. Мы даём ему описание, все функции в текстовом формате, показываем примеры промтов. Это более правильный метод с дообучением, но он занимает время и требует подготовки

  • Короткий. Используем базы плагинов или разрешения куда это уже вшито. Я использую AIPRM — это расширение для Chrome, в котором вы можете выбрать из пользовательской базы промт и просто ввести свою тему. У вас появляется такое окно, и в нём выбираем: Topic — Generative AI, Activity — Midjourney, Ouput — English .И далее вводим описание что вам нужно.

Так выглядит окно ChatGPT с установленным AIPRM

Так выглядит окно ChatGPT с установленным AIPRM

Мне нужно было завтрак в стиле Алисы в стране чудес с множеством персонажей, вот какой промт я получил:

Create an image that depicts a scene from "Alice Through the Looking Glass" where Alice and several other characters are having breakfast in a mirrored room. The characters should be dressed in formal business attire, such as suits, dresses, and blazers. The setting should convey an elegant and sophisticated atmosphere, with a table adorned with a variety of breakfast items like pastries, fruits, and hot beverages. The characters can be engaged in conversation, enjoying their meal, or simply engaged in their own activities. The mirror should reflect the characters and the room, adding a sense of depth and surrealism to the image. The lighting should be soft and warm, casting gentle shadows and highlighting the details of the characters' expressions and clothing, white background

Добавляем параметр --ar чтобы задать нужный размер и получаем очень даже художественную картину:

Я не просил, но аналогия с

Я не просил, но аналогия с «тайный завтра» получилась хорошая

8. Сокращаем промты с помощью самого Midjourney

А теперь повернём ситуацию с ансамблем нейронок в другую сторону. Свежая функция Midjourney /shortnen — она анализирует ваш промт, показывает слова которые она считает шумом, и предлагает 5, с её точки зрения, годных промта.

Проанализируем промт от chatgpt:

Он указывает вес каждого слова, как он будет их воспринимать

Он указывает вес каждого слова, как он будет их воспринимать

Он даёт 5 промтов, от более длинного, к более короткому.
НО! Он игнорирует соотношение сторон из начального промта, просто стоит это не забывать, и при генерации в каждый дописать.

Вот что вышло у MJ по промтам «проверенных лично»:

Тут уже больше упор на именно Алису. Они не плохие, они другие

Тут уже больше упор на именно Алису. Они не плохие, они другие

В этом способе он предлагает сразу 5 вариантов — значит мы получим 20 изображений за 1 клик.

9. Используем библиотеку стилей

Midjourney обучен на миллионах фотографий и изображений разных стилей, и они были размечены разными тегами. Точной документации нету про все стили, но есть прекрасные люди которые исследуют и публикуют найденные стили. Низкий Вам поклон!

Один из примеров обширной библиотеки стилей:

В библиотеке более 2000+ стилей

В библиотеке более 2000+ стилей

Как это работает?

  • Смотрим базу и выбираем стиль, который нам понравился.

  • Нажимаем на название стиля под изображением, он сразу копируется в буфер обмена

  • Добавляем в конце промта этот стиль. Формат: (ваш промт), стиль --параметры

Вот несколько моих любимых :

Просто добавлена временная метка - 1950

Просто добавлена временная метка — 1950

Knolling-правильное расположение предметов

Knolling-правильное расположение предметов

Lego style  - прекрасный стиль, с ним можно любую картинку обыграть

Lego style — прекрасный стиль, с ним можно любую картинку обыграть

10. Ищем вдохновения в сообществе

По правилам Midjourney, если вы используете подписку за 30 USD — то все ваши работы публичные. И на них можно взглянуть «одним глазком». Вот тут публикуются все работы.

Как мы можем использовать это этично и «во благо»?

  • Найти идею. Меня пригласили на вебинар с названием «toolbox маркетолога» — и с ходу что-то не было идей какую сделать картинку для анонса. И я просто ввёл «toolbox» и сразу нашёл несколько направлений и идей что можно сделать. По каждой картинке вам показывает промт, и все характеристики

    Можно взять промт и его переработать, любым методом выше. Можно даже его же использовать - это генеративный ИИ - у вас получится иная картинка.

    Можно взять промт и его переработать, любым методом выше. Можно даже его же использовать — это генеративный ИИ — у вас получится иная картинка.

  • Смотрим похожие работы. Если пролистать ниже, то MJ показывает похожие работы — главное уметь остановиться) Находим что ещё понравилось и снова в круг сансары

    Глаза разбегаются от крутых работ!

    Глаза разбегаются от крутых работ!

  • Анализируем свою работу. После Upscale у вас появляется кнопочка WEB и она ведет вас на вашу публичную работу, где ниже будут подобраны референсы, как выше.

  • Вдохновляемся. Один из важных аспектов генерации изображений — это насмотренность. 5–10 минут в день можно созерцать чудесные творения — анализировать промт, сохранять в фавориты.

Надеюсь мои советы помогут кому-то сэкономить пару часов времени на действительно важные дела. Я не умаляю трудов нейрохудожников — над хорошим изображением надо потрудиться несколько часов. Я рассказал свой опыт когда за пару часов надо сделать сотню изображений образов нужного качества.

© Habrahabr.ru