Как использовать Midjourney: подробный гайд, лайфхаки, промты

Ранее мы рассказывали о своих впечатлениях и результатах тестирования приложений на основе нейросети. В работе над платформой «РСХБ в цифре» мы активно используем Midjourney. В новой статье хотим поделиться своими наработками, которые помогут с нуля разобраться в основных функциях и командах (версия Midjourney 5.1) , чтобы приступить к созданию интересных изображений с помощью этого приложения.

1bec9d2ff959765232ed7f62bb4e5c5e.jpg

Сейчас использовать Midjourney можно только через Discord, где создается учетная запись. Midjourney отображается в Discord отдельным общим сервером, где разные пользователи генерируют изображения в общих чатах. Ещё бота можно добавить на свой личный сервер и взаимодействовать без посторонних людей.

На изображении отмечены общий сервер Midjourney с различными каналами для генерации изображений, и личный, в который можно добавить чат-бот.

b0a0f29d47d31f80b7c6e606c94cc1e3.png

Как работают команды Midjourney в Discord

Взаимодействие с ботом Midjourney в Discord происходит с помощью команд. Команды используются для создания изображений, изменения настроек по умолчанию, отслеживания информации о пользователе и выполнения других полезных задач.

Основные команды

/imagine — генерирует уникальное изображение из короткого текстового описания.

/settings — открывает поле с упрощенными настройками генерации, качества, приватности и т. д.

e578e88c51f86183a7132ce8060d0e54.png

В окне быстрых настроек можно выбрать:

  • версию Midjourney;

  • режим рисования в анимационном стиле (Niji);

  • параметр «Style» (по умолчанию стоит 100 или «Style med», но для придания изображению большей художественной выразительности его можно увеличить);

  • «Public mode» включен по умолчанию; возможность сделать фотографии недоступными для публичного просмотра другими участниками есть только в самом дорогом тарифе, команда также активируется через /private;

  • «Fast mode» или скорость генерации (по умолчанию стоит быстрая или «Fast mode» — если убрать данный режим, то не будет тратиться машиновремя подписки, но генерация изображения может длиться довольно долго, команда также активируется через /relax);

  • «Remix mode» дает возможность вносить изменения в запрос при использовании параметра «Make Variations» после увеличения изображения (об этом чуть ниже);

    5b89d6e98cc3df3eb8ffac3e8ff93210.png

 /info — вызывает окно с информацией по подписке

/subscribe — вызывает окно с возможностью перехода к тарифным планам.

b22d9f68ff9bf3f1bdb8156a6385bc0c.png

/blend— помогает скрещивать изображения, когда мы хотим из нескольких получить нечто общее. Без этой команды тоже можно создать смешанное изображение, но подгружая несколько ссылок и описывая результат.

a956151053ff32bf3a9014b3b57c7bd1.png

/prefer option set— позволяет сохранить часто используемые настройки: вводим команду, далее указываем название для настройки, а после сам параметр через элемент «--».

Пример: /prefer option set mine --hd --ar 16:9 создает опцию под названием » mine», при вводе которой в строку запроса как --mine Midjourney будет считывать ее как --hd --ar 16:9 

Все созданные настройки можно посмотреть через команду /prefer option list.

/help — показывает полезную информацию и советы о боте Midjourney.

Подробнее про генерацию изображений с /imagine prompt

1.    Введите /imagine prompt: или выберите /imagine команду во всплывающем окне команд с косой чертой.

2.    Введите описание изображения, которое вы хотите создать, в prompt поле.

3.    Отправьте свое сообщение.

eb43324b193bb9cbf9d62e6724e768b3.png

Midjourney Bot лучше всего работает с простыми короткими предложениями. Длинные запросы могут ломать логику на сгенерированном изображении или приводить к некачественным результатам.

После завершения генерации появляются изображения и несколько дополнительных командных кнопок:

U1U2U3U4

Кнопки U масштабируют изображение, создавая увеличенную версию выбранного изображения (увеличенное изображение будет немного отличаться от оригинала).

V1 V2 V3 V4

Кнопки V создают небольшие вариации выбранного изображения сетки. При создании варианта создается новая сетка изображения, аналогичная общему стилю и композиции выбранного изображения.

7e47eb5191013e2921926b6c6e69be8a.jpg

Кнопка «Обновить» генерирует новые изображения под текущий запрос.

После использования масштабирования изображения (Кнопки U) появится новый набор параметров:

27e4cb32fcb9b1217a6ba22d0f275765.png637316ad90544960a28ecbb6632d6b4a.png

«Make Variations» создает новый набор из четырех вариантов на основе текущего.

«Web» открывает изображение в своей галерее на Midjourney.com.

«Favorite» помогает отметить лучшие изображения, чтобы их было легко найти на веб-сайте Midjourney.

Недавно была добавлена новая функция «Remaster», не просто генерирует варианты по запросу, а дорабатывает уже сформированный вариант.

Чем крупнее объект на изображении, тем больше шансов, что «Remaster» сработает хорошо. Чем мельче детали, тем сложнее Midjourney заметить и переосмыслить их.

Сейчас функцию «Remaster» убрали, появится ли она снова — ответа нет.

4d230606a7c889c8d9a17bc8603cfaa1.png

Для получения результата, максимально приближенного к желаемому, запросы в Midjourney лучше писать, придерживаясь определенной структуры после /imagine prompt:  

1. сюжет изображения;

2. стиль изображения;

3. информация о размере, освещение и т.д.

Для разделения запроса на составляющие необходимо использовать запятые или двоеточие (при необходимости строгого разграничения).

Пример: beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, warm sunny day: : illustration style: : --ar 16:9

dfc3e31f4909a6ce1e7d1f9eb88df5f0.png

Дополнительные установки в запросах

Важно! Midjourney одинаково воспринимает два коротких дефиса »--» и длинное тире »—»

--ar — устанавливает четкое соотношение сторон.

--q — устанавливает качество изображения; по умолчанию качество равно 1 (--q 2 — увеличивает детализацию, но тратит больше машиновремени, --q 0.5, --q 0.25 соответственно, уменьшает качество, но тратит меньше машиновремени; --q 5 — экспериментальная настройка)

--no — исключает детали, например «--no cow» будет означать отсутствие коров на изображении (во всяком случае Midjourney попытается их не делать).

--uplight — позволяет при масштабировании изображения (кнопка U) уменьшить отличие от оригинала (при увеличении изображения всегда есть небольшая разница, особенно в небольших деталях).

::<число> — если добавить значение от -1 до 2 к любому слову в запросе (в данном случае без пробелов), можно распределить условный вес запроса, то есть важность той или иной подсказки перед другими. По умолчанию значение 1. -1 -0.5 равно команде –no.

Пример: по запросу «/imagine prompt: hot dog::1.5 food::-1» будет создана «горячая собака», не еда;, а по промту «hot dog» будет создана сосиска. Если использовать просто «/imagine prompt: hot:: dog» разделение будет аналогичное.

Разные результаты генерации разных запросов

Разные результаты генерации разных запросов

Когда двойное двоеточие «::» используется для разделения подсказки на разные части, можно добавить число сразу после двойного двоеточия, чтобы назначить относительную важность этой части подсказки.

Пример: hot:: dog сгенерировал горячую собаку. Изменение подсказки на hot:: 3 dog делает слово «горячий» в два раза важнее слова «собака».

Результат генерации

Результат генерации

--iw <число> — устанавливает вес изображения относительно веса текста.

--chaos <число> — вносит разнообразие в результаты. Диапазон значений от 0 до 100. Чем выше значение, тем необычнее будет композиция, но в ущерб самому запросу.

Пример: beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, warm sunny day, illustration, wallpaper --ar 16:9 --chaos 100

Вот что создала нейросеть

Вот что создала нейросеть

Пример: beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, warm sunny day, illustration, wallpaper --ar 16:9 --chaos 0

Совершенно иное видение запроса

Совершенно иное видение запроса

На втором изображении в запросе мы лишь изменились число, написав »0» вместо »100», а результат получили совершенно иной.

--seed — применяется при необходимости создавать максимально похожие изображения; диапазон значений от 0 до 4294967295. Если параметр не указан, автоматически выбирается случайное число.

Пример: beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, warm sunny day, illustration, wallpaper --ar 16:9 --seed 1234567

b36ed0cbdcafe50c65a262499e6cf096.png

--s <число> — стилизация изображения: чем выше значение, тем выше стилизация. 

Например, «--s 500».

Пример использования стилизации

Пример использования стилизации

Немного о дополнительных промтах

Ракурс, угол, план и освещение

Берем промт: beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, wallpaper --ar 16:9

Изображениям в Midjourney можно задавать ракурс. Мы можем получить как портрет, так и вид с высоты птичьего полета. Сразу уточню, срабатывает не всегда на 100%, т.к. очень многое зависит от длины и сложности самого запроса, но, тем не менее, знать об этом стоит.

Когда необходимо получить изображение с прямой перспективой, то дополнительно следует указать «Looking into the camera» или «full-face». Однако Midjourney часто сам предлагает именно такие визуалы.

Если требуется вид сверху, то самые простые варианты «drone shot photo of» или «birds-eye-view photo». Варианты похожи, но также могут варьироваться в зависимости от запроса.

 Пример: Drone shot photo of Beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, wallpaper --ar 16:9

a07f4faf51c8bc5c7141e3e111d71a7e.png

Пример: birds-eye-view photo Beautiful happy cow in a meadow with flowers in perfect hair to spike, high wool detail, wallpaper --ar 16:9

bb4cdc990329c00449954c8d6dd7497e.png

Также можно немного приподнять угол обзора при помощи ввода указания «High- angle photo of» или опустить камеру через запрос «a hip/knee/ground level shot of» (срабатывает чаще) или «view from below».

Результат использования запроса «view from below»

Результат использования запроса «view from below»

Вид снизу и не очень (иногда и такое бывает). Иллюстрации ниже.

e2417f188745b89f64640f690d933856.png2de1e11828e0663cef46a423d674fc87.png

При необходимости получить определенный угол обзора, используем «in profile», «three quarter view», «back view». Сразу уточню, что на людях данные настройки работают определенно лучше, но т.к. у нас корова, будем работать с ней.

6cb7f609a26006210aae1833490096e6.pngРезультат использования «three quarter view»,

Результат использования «three quarter view»,

d8a69c92d6efdfde0cb28430afa7cbbf.png

Изображение можно сделать разного плана: портрет, средний план, в полный рост или издалека. Для этого к запросу добавляем «closeup photo» или «closeup shot», «medium-full photo/shot», «full photo/shot» или «full body photo/shot».

Соответственно, если хотим изобразить группу объектов, помещающихся на изображении целиком или видимые издалека, используем «long photo/shot»,  «a wide photo/shot» и «view from afar». Попробуем также эффект рыбьего глаза или «GoPro».

Важно! Обратите внимание: использование в запросе противоречащих друг другу описаний не будет приводить к желаемым результатам, например, мы хотим получить вид издалека, но, при этом, указываем на довольную морду коровы или высокую детализацию шерсти.

Для примеров «long photo» и «view from afar» сделаем запрос чуть проще: cow in a meadow, --ar 16:9»

2442a1e277e8b0bc5ebff645c0080d03.png«medium-full photo»

«medium-full photo»

«full body photo»

«full body photo»

«long photo»

«long photo»

«view from afar»

«view from afar»

Эффект рыбьего глаза тоже выглядит довольно интересно, добавляем «GoPro»

19ce4bcd95b5203c4fbe657d1483b949.png

По вариантам простого освещения все предельно легко. Необходимо просто указать в запросе тот временной интервал или источник света, который необходимо получить, например: «sunny afternoon», «daylight», «incandescent light», «backlighting» и т.д.

В конце

Midjourney является отличным инструментом для дизайнеров, иллюстраторов и многих других людей творческих профессий. Этот инструмент позволяет воплощать в жизнь самые смелые идеи, создавать необычный и уникальный контент в различных стилях и вариациях. Желаемый результат не всегда получается с первого и даже с десятого раза, но, тем не менее, пробуйте и экспериментируйте.

© Habrahabr.ru