[Перевод] Машинное искусство и стиль Midjourney на примере круга

Как материалы, настроения и среды влияют на генерацию круга

Этот текст для тех, кто хотел бы посмотреть на MidJourney в деле, но не может выделить время, чтобы, наконец, попробовать. А ещё для тех, кому нужно отвлечься от рабочей среды и погрузиться во что-нибудь, что увлекает и расслабляет внимание. Материалом для отдыха делимся к старту флагманского курса по Data Science.

29c6e1590742ab1108376db6663df8d1.png

Рассвет. Огромное кольцо жёлтого света плывёт в воздухе над двумя силуэтами. Пустынный ландшафт простирается к высокой скале-останцу из песчаника. Позади круг из клубящихся облаков.


Все изображения созданы в MidJourney по указаниям автора.

Midjourney — это генератор изображений с искусственным интеллектом. Входные данные для генерации задаёт человек (обычно с помощью текстовых описаний и параметров, но для этого используются и другие изображения). В программе реализован алгоритм машинного обучения. Для обучения использовано огромное число изображений и данных о них, что позволяет искусственному интеллекту создавать уникальные изображения.

Как и большинство моделей машинного обучения, Midjourney — в какой-то мере «чёрный ящик». Алгоритм программы весьма сложен. Неспециалисту трудно понять, что происходит между получением текстового описания и созданием изображения.

Однако мы вполне можем проанализировать изображения, которые получаем после ввода данных, найти закономерности и сделать предположения. Не факт, что это поможет понять, как работает система, но можно научиться лучше ею пользоваться.


В этом тексте я часто очеловечиваю Midjourney. Я, конечно, в курсе, что она не может ничего обдумывать, представлять, любить, не любить или чувствовать


Круг

Если вы попросите случайного человека нарисовать круг, этот человек, вероятно, возьмёт чистый лист бумаги или разлинованный блокнот и в нём ручкой или карандашом нарисует окружность.

Что же произойдёт, если мы попросим об этом Midjourney?

209a2e0989382b08a6e2e91876f9b86f.png

Тонкий бело-жёлтый сияющий круг, слегка освещающий тёмный густой лес позади него. Бирюзово-оранжевые тона угасающего заката, переходящие в чёрную тьму по краям.

Текстовое описание: A circle («Круг»)

Как видите, в простых описаниях Midjourney сама заполняет множество пробелов. Всё, что человек оставляет неназванным, она сводит к «броскам игральных костей». Прогоните такое описание через систему 10 раз и, вероятно, получите 6–8 совершенно различных во многих аспектах изображений, но все они будут схожими во множестве черт. Судя по всему, что без описания стиля и цвета система по умолчанию склоняется к голливудским бирюзово-оранжевым тонам. А ещё она очень любит облака. Как видите, по умолчанию у неё довольно специфические предпочтения в живописи.

Мы можем попросить её унять свою буйную фантазию. Если мы введём более конкретное описание, результат будет больше похож на то, что нарисовал бы человек.

5e11c5af100a609bbf3f7c835fa492b5.png

Набросок угольком в форме кольца. Беспорядочный и незамкнутый, но с акцентом на свет и тени. Линии сетки намечены на листе слабым карандашом. Похоже на страницу из блокнота.

Текстовое описание: A pencil line drawing of a circle («Карандашный набросок круга»)

Несмотря на это, детализация намного выше, чем мы ожидали бы от человека, и для её снижения потребуется немало проб и ошибок.

1b49215d35a25ade4cc565675e5501e1.png

Воображаемый карандашный круг на белой бумаге, заключённый в больший карандашный круг, который выглядит так, словно кто-то сделал карандашный росчерк на дне кофейной кружки. Темная тень покрывает правый нижний угол бумаги.

Текстовое описание: A simple pencil outline of a circle on white paper («Окружность простым карандашом на белой бумаге»)


Материалы

Midjourney исключительно хорошо имитирует различные материалы. Она знает основные свойства, формы и цвета многих интересных материалов. Играя с ними, мы можем получить очень интересные результаты.

9d78756f9df06db82e7b2ab28c91fb0f.png

fbfe1e37d6688fe4f65e82c4570ca04b.png

8f3031e907dc50858acc61998057f757.png

Текстовые описания: A circle made of branches, bronze metal, and grass («Круг из ветвей, бронзы и травы»)

65a5670a6b427351650f7cfc179aac23.png

4d5ad071fdb350570e415a4f21033486.png

2c7f12f794b0acf6e193c8f25fd844f7.png

Текстовые описания: A circle made of ice, emerald and gold, and embers and ashes («Круг изо льда, золота с изумрудом и янтаря с золой»)

b95a8a8941a44792ce55609fc13f3223.png

6a9c53dc9d296f96f40b96314005b76b.png

26a92c8e1b9711af2b2914dd719c47e6.png

Текстовые описания: A circle made of liquid gold, wood, and feathers («Круг из жидкого золота, дерева и перьев»)

Указание на материалы и цвета может стать изюминкой ваших текстовых описаний. Экспериментируйте с их сочетаниями, которые могут быть как очевидными, так и невероятными. Посмотрите на материалы вокруг вас. Рядом со мной сейчас лежат мятая бумага, чёрный пластик, шлифованный алюминий, серый плетёный хлопок и голубая пена. Черпайте вдохновение во всём, что вас окружает.


Настроения

Midjourney хорошо работает с поэтическими описаниями и прилагательными, если вам не требуется что-то особенно специфическое, а достаточно просто вызвать соответствующее настроение.

Лучше всего оставить программе простор для интерпретации и позволить ей бросить кости. Как вы можете заметить, различным настроениям соответствуют различные цветовые схемы (синий соответствует меланхолии, красный — ужасу), но часто любимые программой бирюзово-оранжевые тона всё равно проскальзывают.

1d79f9503bbf8f8dfa6569c796cbbc46.png

Тёплые цвета рассвета озаряют зависший в воздухе круг из переплетения густых ветвей. Форма близка к идеальному кругу, на верхних ветвях листва зелёная, а на нижних — бурая и сухая. Снизу на круг кто-то смотрит: виден лишь силуэт. Небо позади круга заволокли облака.

Текстовое описание: A mysterious circle («Таинственный круг»)

1d7b293af0c5380b44fae15ad2d6ea4d.png

Огненное кольцо выглядит как портал в тёмный, жуткий и почти симметричный лес. Очертания ветвей образуют подобие лица, но в темноте нельзя с уверенностью сказать, что это лицо.

Текстовое описание: An evil circle («Круг зла»)

7925afcca2da167edc66e7d7d3459579.png

Холодное серо-синее небо, по краям композиции беспорядочно растут деревья. Человек смотрит на бежевое кольцо в небе, наполненное синевой, темнеющей к центру круга, что делает круг похожим на портал в тёмные времена.

Текстовое описание: A circle of melancholy («Круг меланхолии»)

66e09ff2502688cedf07947b339345bb.png

Круг, образованный из негативного пространства. Его оранжевые и бирюзовые цвета напоминают закат, но тёмно-синий внутренний круг похож на дерево, растущее из его вершины. Это дерево проникает в негативное пространство, слегка нарушая его целостность. Края круга неровные. Какая-то фигура смотрит на круг снизу вверх, она как будто видит его во сне.

Текстовое описание: An imaginary circle («Воображаемый круг»)

1b4f97025acaa18dbe19bac71e786b27.png

Круг похож на северное сияние, он дополнен полукругом и светится в ночном небе. Он выглядит как что-то сверхъестественное. Внутри видны очертания ветвей деревьев, которые словно светятся в небесной вышине.

Текстовое описание: An ethereal circle («Эфирный круг»)

9e335a7ae8ebeca807d6499b4cf674ba.png

Тёмная чёрно-красная пустота, окружённая кругом из песка. Со всех сторон стоят фигуры в чёрно-красных тонах, эти фигуры утопают в чёрно-красном шуме.

Текстовое описание: A horrific circle («Страшный круг»)

4b521c837e7322c72e1a9876ca07b02f.png

На безликой коричневатой стене висит круглая картина. Внешняя часть круга расписана акварельными тёмно-синими и чёрными тонами, а внутренняя образована белёсыми ивовыми ветвями в форме круга с розовыми и оранжевыми цветами, которые распускаются в нижней половине круга.

Текстовое описание: A blossoming circle («Цветущий круг»)


Стили

Стиль по умолчанию, который можно назвать midjourney painting, можно заменить на другой с помощью ключевых слов и параметров. Если вам нужны определённый стиль живописи, 3D-визуализация, глиняная скульптура или определённые стили иллюстрации либо фотографии, Midjourney, с большой долей вероятности, поймёт, о чём идёт речь.

32ba57e4305b5e9c5e6583402dd9b1bd.png

Зернистость чёрно-белой плёнки, перекрывающиеся тени колец и прутьев, резко освещённые контровым светом со стороны экрана.

Текстовое описание: A circle in a film noir («Круг на чёрно-белой плёнке»)

19e33947b15373bdab1d296e58167df7.png

Атмосферно затуманенная ночная улица. Потрескавшийся асфальт подсвечен тонким кругом тёплого света, что напоминает светопись с длинной выдержкой. Он обрамляет исчезающие в тумане скамейки для отдыха в парке, а вдалеке горят рекламные щиты и уличные фонари.

Текстовое описание: A circle rendered in Octane with volumetric lighting and fog («Круг, визуализированный в Octane, с объёмным освещением и туманом»)

Octane — инструмент визуализации 3D-работ, обычно с реалистичными физическими свойствами и освещением. Как вы увидите, он часто используется в Midjourney для детализации определённых сцен. Это видно по тому, как кольцо света освещает асфальт.

da323502b65121333d07916b58b43002.png

Круг, похожий на вид сверху на древний глиняный горшок, выставленный в музее. Яркое освещение сверху подчёркивает резьбу по ободу. В центре круга глина похожа по форме на водоворот, как будто её изготовили на скорую руку на гончарном круге.

Текстовое описание: A circle sculpted from clay («Круг, вылепленный из глины»)

5cadef0678f861ad6abc179f834b2f7b.png

Чернильная окружность с более тонкими линиями, точками и углами. Напоминает технический чертёж или абрис без текстовых указаний или описаний.

Текстовое описание: A technical drawing of a circle («Технический чертёж круга»)

c1e22d45bb7dcb5bd9564be7d32ddf0f.png

Круглый холст на коричневой стене. Холст зарисован неровными синими, жёлтыми, красными, оранжевыми, зелёными и фиолетовыми мазками. Тона внутри круга становятся более тёмными, но в середине — светлый круг. Это придаёт картине ощущение глубины.

Текстовое описание: A watercolor circle («Круг акварелью»)


Окружение

Если мы просто напишем A circle («Круг»), общая тема композиции будет выбрана по умолчанию. Всё меняется, если мы словесно опишем среду, в которой находится наш объект. Как видите, даже без подробного описания самого объекта окружение может придать ему интересный и даже неожиданный вид.

75b158fa1bcbf8949460898c7d6e314d.png

Пейзажная живопись, луг полон цветов, вдали виднеется одинокое дерево. Вблизи на земле находится круг, нарисованный в перспективе, образованный розовыми, голубыми и оранжевыми цветами.

Текстовое описание: A circle in a field of flowers («Круг на цветущем лугу»)

223fafa7308ca4941280f4c734be98a4.png

В нижней части композиции на море бушует шторм, фон закрыт серыми тучами. Вихрь волн в центре композиции образует круг, физически невозможный, но грозный и прекрасный.

Текстовое описание: A circle in stormy seas («Круг в бушующем море»)

c8f73ce685c611b3ed82643ef27d4382.png

Небольшая лесная поляна с разноцветной листвой на заднем плане. На поляне — круг из грунта, около двух метров в поперечнике, выглядит так, словно кто-то ходил здесь кругами дни напролёт и вытоптал всю траву до сухой земли.

Текстовое описание: A circle in a forest («Круг в лесу»)

dcaa74f583542ae760a7baee777914d8.png

Более абстрактная пейзажная живопись; большую часть композиции горного пейзажа занимает бескрайнее небо. Между горами завис в воздухе огромный оранжевый круг, нижняя часть которого теряется в тумане и за ближайшей горной цепью.

Текстовое описание: A circle in the mountains («Круг в горах»)

b99df637ffd392d6b7f18ebca0c5f080.png

Круг яркого света, похожий на арку или дверь, освещает узкий и тёмный городской закоулок. В закоулке нет других источников света, кроме этого круга и приглушённого красного света из окон домов.

Текстовое описание: A circle in a dark alley («Круг в тёмном закоулке»)

4ed29d10d2e0283fc086bc88be6ca805.png

Огромное круглое помещение в стиле модерн, возможно, вестибюль, с отражающим оранжевым кругом на полу, тёмным внешним кольцом цвета морской волны. Несколько офисных кресел повёрнуты к окну в дальней части помещения. Оранжево-белое кольцевое освещение обрамляет внешний край потолка. Окно окружают синие и жёлтые стеновые панели. В помещении нет людей и признаков их присутствия.

Текстовое описание: A circle in a corporate office («Круг в офисном здании»)


Соотношение сторон композиции

Соотношение сторон заметно влияет на создаваемые композиции и изображения. Если вы решили напечатать любую картинку на формате А2 или поставите её фоном на компьютер/телефон, сначала ознакомьтесь с соотношением сторон листа и ориентируйтесь на него. Потому что подогнать под эти форматы, скажем, квадратное изображение, чрезвычайно трудно.

04bec0e46adc908ed6f742c7bacef3c4.png

ab2b5c5b6b7070ab14c5dad4415b78d9.png

Текстовые описания: A circle in (9:16) and (16:9)


Художники

Midjourney может подражать стилю конкретного художника. С этической точки зрения, это самый спорный способ применения искусственного интеллекта. Особенно если предполагается любое коммерческое использование. Люди могут копировать стиль других людей и делают это, но, когда это поручают искусственному интеллекту, становится неясно, где искать грань, которую нельзя переходить. Больше всего это (по понятным причинам) волнует современных художников и всех тех, кто достаточно известен, чтобы система могла их распознать. С юридической точки зрения и позиций авторского права, такие работы считаются уникальными (на сегодня), что может вызвать неодобрение людей.

26c65245acb98fc68f8ff65f31d17504.png

3ad53749f24ad777c112fe2f5b5650a7.png

fbcd929111cc6b3f6eb1536b50bd8ac2.png

Текстовое описание: A circle in the style of Vincent Van Gogh, H.R. Giger, Jackson Pollock («Круг в стиле Винсента Ван Гога, Ханса Руди Гигера, Пола Джексона Поллока»)

Такой же «серый статус» и у популярного описания rending on Artstation («популярный на Artstation»), которое усредняет стиль не одного конкретного художника, а большую часть работ и стилей, что можно встретить на Artstation.com. Этот ресурс очень популярен у художников, которые участвуют в создании фильмов, игр, концепт-арта и иллюстраций.

8376ab18985a77312b19e3b36e2bc940.png

Массивное кольцо жёлтого света чётко вырисовывается в закатном небе. Оно окружено оранжевым ореолом и расположено прямо над скалистыми горами посреди пустыни. Напоминает «Близкие контакты третьей степени», но гора шире и ниже пресловутой «Башни дьявола».

Текстовое описание: A circle trending on Artstation («Круг, популярный на Artstation»)


Комбинации и эксперименты

Эта статья затрагивает лишь малую часть бесконечных возможностей программы, которые определены лишь вашим воображением, вкусом и направлением деятельности. Сочетайте все описанные нами концепции со многими другими, чтобы создавать уникальные изображения, способные радовать и вдохновлять вас и других.

689ebbd1c0a9d549ef3ea2592cafb8cb.png

Тёмно-зелёный туманный лес со сплетающимися чёрными ветвями. Золотой портал находится в правой части композиции, маленькие огоньки летают вокруг портала как светлячки, возможно, они притягиваются к нему.

Текстовое описание: A mystical circle made of tree branches and liquid smoke in the trees of a lush jungle at night. Terrifying and magical. Gold accents («Мистический круг из ветвей деревьев и жидкого дыма в густых джунглях ночью. Пугающий и волшебный. Акцент на золотом») (16:9)

46884cdd8a2a5d2cf873fe354cbdf672.png

Огромный деревянный круг лежит на песке, его обтекают песчаные волны, выглядит так, как будто он лежит тут много месяцев. Чёрно-белая фотография.

Текстовое описание: A black and white photograph of a lonely wooden circle, abandoned in the sand dunes («Чёрно-белая фотография одинокого деревянного круга, брошенного среди песчаных дюн») (16:9)

f3fe17ebb96f42fd012dac8e1a9bc2aa.png

Адский апокалиптический пейзаж из тёмного фэнтези, густой дым и огонь собираются в круги, тёмные силуэты блуждают по заболоченной пустоши.

Текстовое описание: A circle of fire and smoke in a forgotten wasteland abyss» («Круг из огня и дыма в забытой пустоши над бездной) (16:9)

Спасибо, что прочитали.

А если хотите обрести крепкую опору под ногами — смотрите программы обучения Data-профессиям:

Новогодняя акция — скидки до 50% по промокоду HABR:

j2_ogfhj6eyshhs0_viq_hce12i.png


Краткий каталог курсов

Data Science и Machine Learning

Python, веб-разработка

Мобильная разработка

Java и C#

От основ — в глубину

А также


© Habrahabr.ru