Stable vs Photoshop: сравнение генераций

image

Привет, меня зовут Юля, 85GB и я веду свой канал по нейронкам.

Сегодня хочу обозреть и сравнить плагин Stable Diffusion (на базе интерфейса Automatic) для Photoshop и Generative Fill на базе Adobe Firefly для него же. По каждому пункту нейронки будут получать либо 1 балл, либо 0. В данном случае мне так удобнее вести счёт.

Примечание

Надеюсь, вы знаете, на каких торрентах надо скачивать все виды бесплатного ФШ, в том числе и с функцией генеративной заливки.


Плагин Стейбла с инструкцией лежит здесь.

Содержание:

1. Системные требования
2. Интерфейс и порог вхождения
3. Вариативность
4. Ликвидация объекта с фотографии
5. Добавление фона
6. Добавление объекта
7. Замена объекта
8. Замена фона
9. Txt to img
10. Img to img
Выводы

Итак, приступим.

  1. Системные требования. Пожалуй, самый важный пункт, без которого нет смысла продолжать работу. Стейбл — локальный, и ему необходимо очень много видеопамяти. У меня карта на 8 гигов, и при обработке больших изображений требуется работать с малыми областями или уменьшать эти самые изображения примерно до 1000 пикселей по длинной стороне (а то и до 512), и это невероятный мизер, если речь идёт о качественной пикче. Скорее всего, в комментариях будут писать о том, как именно можно апскейлить через сам Стейбл, делать там текстуру и качество. Но их же можно изначально не терять, правда?

    Файрфлай обращается к облаку, не нагружает видеопамять и позволяет спокойно работать с фотками размером 6000×4000 пикселей. Единственный минус в данном случае — при отсутствии подключения к сети Адобовская нейронка работать не будет.

    Скорость генерации изображения размером 512 px в Стейбл Диффьюжн и Адоб Файрфлай ≈ 12 секунд. Генерация пикчи 6000 px по длинной стороне в Файрфлай ≈ 20 секунд.

  2. Интерфейс и Порог вхождения. Для тех, кто ранее не был знаком (!) со Стейбл Диффьюжн, интерфейс плагина будет непонятен. К тому же, перед установкой самого плагина нужно скачать и поставить на комп Стейбл от Automatic1111. Помимо этого, для каждого вида генерации нужна своя модель, которая при этом должна поддерживать функцию inpaint, потому что всё происходит непосредственно в ней. Эти модели нужно искать и качать отдельно. И для кого-то это безусловный плюс, но если мы всё же не будем отметать нубов типа меня, то обратим внимание на простой и понятный интерфейс Адоб Файрфлай.
    image

    image

    image

    — Да, вот эти крошечные окошечки являются интерфейсом генеративной заливки Файрфлай.

    Работа в обеих нейронках происходит следующим образом: выделяем объект, пишем или не пишем промпт, жмакаем Генерировать. Так как работа происходит внутри ФШ, выделить объекты можно десятком способов, в том числе и автоматически.

  3. Вариативность. Стейбл выдаёт 4 варианта сгенерированных картинок на выбор, а Файрфлай — 3. Предел нейронки от Адоба — 50 изображений, далее надо удалить слой и начать круг генераций снова или выбрать из имеющихся вариантов. У Стабильной Диффузии формально нет предела, как и нет списка всех генераций, поскольку каждая принятая генерация (помеченная галочкой в интерфейсе) — это новый слой. В случае с генеративной заливкой Адоба все варианты находятся в свойствах ОДНОГО слоя. Обе системы по своему нагружают комп: Файрфлай провисает при пролистывании большого количества вариантов, а в случае со Стейблом приходится вычищать множество лишних слоёв. При таком раскладе оценивать очень сложно, поэтому обе нейронки получают по баллу.

    s9hst0vsf9mcihglroh7-lgne3s.jpeg

  4. Наконец-то мы можем приступить к генерации. Здесь я возьму фотографию собачки, любезно предоставленную моей подписчицей (спасибо, Нина) и попробую убрать её вообще, не вводя никаких промптов.

    bn-sbhjxcgnte8tnh-i8nsrps-e.jpeg

    Для того чтобы реализовать автоматическую замену объекта в Стейбл, нужно на максимум выкрутить ползунок Denoising Strength, таким образом мы показываем нейронке, что она может фантазировать на полную. По традиции Стейбл Диффьюжн, она фантазирует голых девочек и женщин, но были также и зверушки.

    imzp-cudsmqd19flerkudod0mpm.jpeg

    Я выбрала птичку, потому что это самое маленькое существо в заменяемой области и потому что появилась некая трава на фоне. Самое странное в данном случае — остался контур собаки. Почему-то он Стейбл делает маску с растушёвкой, которую нужно подчищать дополнительно. С генеративной заливкой Файрфлай такого не происходит, нейронка по дефолту воспринимает собаку как лишний объект и создаёт заливку из окружения.

  5. Добавление фона. В этом раунде я попробую догенерировать фон без промпта. И да, Стейбл так не работает, а Файрфлай справляется прекрасно. Что, впрочем, не новость, поскольку по сети уже гуляет множество догенеренных мемасиков, картин и всякого такого.

    mlrczlgpycsrrri71_3kyfeugga.jpeg

  6. Добавление объекта. Здесь мы оценим добавление объекта внутрь изображения. В обоих случаях пришлось немного повозиться с промптами, чтобы получилась именно стая птиц, а не одна-две, но с размытием генеративная заливка Adobe справилась лучше. Промпт: a flock of many birds far away

    xqt4ca_4axvqkchn-miz5zuygcc.jpeg

  7. Замена объекта. Для начала простое — заменим то́ллера на добермана. Просто ввожу в командную строку промпт doberman. Для Стейбла в качестве эксперимента я прописала ещё и негативный промпт, но разницы в итоге не увидела. И это хорошо, поскольку означает, что мы можем обойтись без этого гемора, нейронка всё же ориентируется на изображение.

    twloryaplcsnslpt9a3l9dof87k.jpeg

    Здесь видно, что Стейбл максимально старается заполнить область новой собакой, как бы подменяя ею предыдущую, в то время как Файрфлай создаёт пса в какой-то странной позе. При этом ни одна собака не является доберманом и качество генерации сильно хромает, так что здесь у нас очередная ничья. Но не всё так просто. Нам же нужно практическое применение, правильно? Сразу оговорюсь, что обе подключеных к ФШ системы не в состоянии поправить руки, завязанные в узелок при генерации, или сгенерировать сложный фон позади человека типа концертного зала (все люди в кашу), но кое-что они всё-таки умеют.

    Вы видите перед собой кусок фотографии, которую я сделала в туристическом месте, поэтому там на фоне тачка. И её надо бы убрать. В обоих случаях пришлось заморочиться с промптами, добиваясь приемлемого результата. Не могу сказать, что на 100% довольна обеими нейронками, но здесь я скорее тоже склоняюсь к ничьей.

    vmqyoytf8gzn-emfei4qci6s3xu.jpeg

  8. Замена фона. Её я вынесла отдельно, поскольку, как выяснилось, «этодругое». Например, нейрозаливка Адоба может нативно сгенерить хорошую циклораму под объект (сохраняя при этом оригинальный размер пикчи, напоминаю). Стейбл, увы, здесь не справился, и хотя я пыталась направить его с помощью негативного промпта, то, что вы видите перед собой — это максимум, который мне удалось получить. Он принципиально не хотел делать розовый фон, обращаясь к оригинальному, сероватому. Для предметников, ящитаю, это мастхэв, когда не нужно покупать 10к фонов.

    05y1xi9ano37ifxyp0pfhex5nai.jpeg

  9. Txt to Img. Попробуем из пустого белого слоя воссоздать с помощью промпта аналогичную картинку с собакой. Промпт: the dog is sitting on a log in a clearing, against the background of a river and a forest. Негативных для стейбла здесь использовано не было

    _vv9odo9lacuvwiwrsfnv_dkkjy.jpeg

    В обоих случаях получилась дичь разной степени. Стейбл как будто бы лучше справился с собакой, а Файфлай — с травой. Второго можно было бы выбрать за то, какую область он заполнил, но качество генерации меня совершенно не устраивает, поэтому здесь я тоже ставлю ничью.

  10. Img to Img — это функция Стабильной Диффузии, которая отвечает за то, чтобы превращать одно изображение в другое с максимально схожим визуалом. Но я пока не знаю, есть ли такая функция у Файрфлай, давайте проверим.

    6z8xz98zn7x2xtzx8xkdgskij80.jpeg

    Очевидно, что у нейронки Адоб нет подобного функционала и она не воспринимает подложку как нечто, что надо «улучшить», генерируя совершенно иное изображение просто под промпт, хотя и безусловно качественное.


Выводы. Начнём с оценок:
Штош. В данном случае очевидно, что Адоб, несмотря на недостатки, разносит Стейбл на своей территории. Могу сказать, что генеративная заливка на базе Файрфлай действительно прекрасный инструмент для фотографов и дизайнеров. Генеративная заливка отлично справится с обрезанными частями тел, зданий, простенькой заменой фона, добавлением предметов и т.д. Стейбл же в данном случае является хорошим подспорьем для художников, создавая подмалёвок или помогая в генерации с нуля каких-либо объектов вместо сбора сотни референсов.

Надеюсь, этот обзор был полезен и поможет вам в выборе. Спасибо, что дошли до конца. Всем чмаффки, и подписывайтесь на мой канал.

mxuanbovcusqgmqdgugvpnql8vq.jpeg

© Habrahabr.ru