Как нейросети всё делают за меня, а я за них

Ремар«очка: это не туториал, а просто подробный разбор процесса.

Допустим, моя задача — генерация «фотосессии» с разными людьми в разных ситуациях. Например, мать обнимает ребёнка и держит в руках пасхальное яйцо. Обстановка домашняя, светлая.

С чего начинаю?
С разбора ТЗ и похода в ChatGPT за промптами. Потом в Midjourney — там генерирую серию картинок в едином стиле, с разными людьми и сюжетами. Минимум 30 штук: бегущие дети, объятия и т. д. — чтобы потом собрать из них датасет.

492901b80347ee094a88c18366ae37b2.png

Дальше отбираю удачные варианты: смотрю на ракурс, образы, цвета и текстуры.

После этого загружаю картинки в Krea для тренировки стиля. Таким образом я получаю:

— стиль Midjourney,
— анатомию Flux,
— удобное управление промптом во Flux.

Krea позволяет работать с разными моделями, но тренировка лоры и генерация в стиле этой лоры происходят именно на Flux.

9fee6277f47dbddb3d9a8391ef77b8cb.png

Теперь могу сгенерировать нужный сюжет сразу в баннерном разрешении 16:9. Для начала покажу картинку без стиля:

a58586b13c1fe05ceb387b96fd5d6141.jpeg

А вот с настроенным стилем:

496ffcafa3d76bfeab7d8f95dbf5b33d.png

Так создаю целую серию. Если работаю с брендом, уточняю для ChatGPT, какие нужны сцены, цвета, одежда, интерьеры, и получаю пул промптов для генерации.

Далее первичная ретушь. Мне нравится глубина на этом кадре из-за цветка на переднем плане, но он будет мешать тексту. Вообще, здесь мало места под текст, так что надо сделать аутпейнт (расширение картинки с догенерацией, см. мой нейрословарь).

a2de4c5b932721475b1e872523c64805.png

Апскейл. Можно провести только в Магнифике (х4, иногда х8), но если исходник слабый, например, мелкие фигуры людей вдали, то Магнифик внесет много своей анатомии. В таких случаях сначала делаю предварительный апскейл во Flux на компе — получится мыльновато, но поправится анатомия и общие черты персонажей.

Вот яркий пример косяков — после Magnific у свитера появились артефакты, а лицо ребёнка порядком состарилось:

7a7a91fad8358222996082b0b0191bf3.png

Но допустим клиент выбрал именно это фото под большой баннер. Тогда маме надо распахнуть глаза, чтобы она смотрела на дочь + её взгляд будет условно направлен в сторону пустой зоны, зоны текста. Ну и конечно, девочку снова нужно сделать девочкой. Чтобы всё это провернуть, иду в Фотошоп, отрезаю от изображения кусок с «неправильным» участком и инпейнчу его в Идеограм или Флакс.

Фотошопный инпейнт использую редко — он больше подходит для удаления мелких деталей. Картинку режу на части, иначе либо комп не потянет, либо Ideogram выдаст маленькую мутную версию (в зависимости от того, где редачу картинку).

Итак, в случае с лицами и свитером получаем это:

8f5d81fdca3805b4ca3c7fd4e63127fc.png

Такие же манипуляции проделываю с руками, ногами, одеждой и т.д. для этого и других изображений. Ну, а после их можно ставить на большие баннеры с кайфом:

07d2a07e5ddd01401b086a3f493e0994.png

Если вы знаете локальный апскейл, который бы давал такую же классную резкость и текстуру как Магнифик, напишите об этом в комментариях. И подписывайтесь на мой канал, где я рассказываю о работе дизайнера с нейросетями.

© Habrahabr.ru