Нейросети убьют 2d художников
Никого они, конечно, не убьют, но рынок труда в ближайшие пять лет поменяют точно. Произойдёт это постепенно, плавно и заметно будет только на значительной дистанции, в моменте глядя вперед или оглядываясь назад, мы не увидим каких-то значительных сдвигов как и при любом эволюционном процессе.
За последние год-полтора нейронные сети, которые превращают текстовый запрос в картинку, сделали очень серьезные шаги вперед. Я много слышу от коллег, да и сам уже применяю в реальных задачах возможности, которые предоставляют такие инструменты. В этой статье я хотел бы поразмыслить о том, как это все повлияет на нас — людей создающих арт для индустрии развлечений в общем и игровой индустрии в частности. Я не буду рассматривать особенности конкретных нейронных сетей или существующих сейчас решения — материала на эту тему достаточно.
Сегодня
Прямо сейчас нейросети, создающие изображение, вроде Stable Diffusion или Midjourney (далее просто нейросети) — это скорее хобби. Художники с опаской или азартом изучают недра этих алгоритмов в поисках интересных идей или просто из любопытства, проверяют их на прочность и исследуют границы возможностей. В реальном производстве это все скорее инициативы или эксперименты, полноценных и успешных пайплайнов (студийных) с использованием нейросетей мы не видим (но это не значит что их нет). Сейчас это уровень персональных воркфлоу, как это было в момент популярности VR инструментов.
Нейронные сети можно уже вполне реально использовать для таких задач как генерация идей, поиск композиции, генерация деталей для фото башей и, пожалуй самое удобное и востребованное сейчас — создание портретов.
Главным ограничением является неудобство этих инструментов. Формат работы с ними не похож на использование традиционного софта, требует времени на освоение, недостаточно гибок и в любом случае требует значительного опыта в софте традиционном. Сделать что-то продакшн уровня «из коробки» не получится, в любом случае потребуется как подготовка с использование стороннего софта (например фотошопа или блендера для создания маски под генерацию), так и дальнейшая, ручная, доработка полученного результата. Но все это не останавливает огромное количество энтузиастов, как совсем новеньких в этой сфере так и тех, кто рисует уже десятилетиями, изучать эту интересную и точно очень перспективную нишу.
Вчера
Без взгляда назад не получится заглянуть вперед. Когда я только начинал заниматься CG и в частности 2d артом (в середине 2000), использование 3d или фотографии в иллюстрации и концепт арте было крайне редким явлением. Многие пытались, но сталкивались с серьезными ограничениями по мощности железа и доступности инструментов. Между 2d и 3d артом проходила явная концептуальная и инструментальная граница, которая сейчас практически стерта.
Быстрые и простые рендеры, развитие 3д редакторов, повышение мощности железа, развитие интернета позволили внедрить в процесс производства 2d арта много новых методик и подходов. Современный концепт художник или иллюстратор в 90% случаев (в индустрии развлечений) использует 3d и фото-баш в своей работе. 3D и использование фото позволяют делать реалистичные арты, с более сложной перспективой, светом, композицией; делать больше вариантов, пробовать и проверять больше идей и все это значительно быстрее.
Знание этих инструментов привело на рынок труда множество новичков, которым в силу отсутствия классического художественного образования эта область могла бы быть вообще не доступна, однако они активно нивелируют пробелы в опыте знаниями в области инструментария.
Индустрия изменилась, она не отбросила прочь людей которые рисуют «одной круглой кисточкой», но рынок заставил их обучиться новому инструментарию и привел множество новых людей.
Завтра
В ближайшие пять лет в таких областях как концепт арт и иллюстрация нейросетевые инструменты, скорее всего, вытеснят инструменты традиционные. Чтобы удержаться на рынке и составить конкуренцию волне новичков, которые с этими инструментами заходят — придется осваивать новое, изучать возможности нейросетей и думать, как их применять в своей работе.
В ближайшие 1–2 года будут активно развиваться интерфейсы — уже сейчас есть удобные и практичные оболочки, с помощью которых процесс можно ускорить и сделать более наглядным. Следующий шаг — активное смешивание разных моделей и подходов. Выделение специализированных сетей обученных на конкретные задачи (например только аниме и только концепт арт в реалистичном стиле и т.д.). Все это будет объединено в единые программные комплексы с удобным инструментарием, позволяющим гибко, быстро и просто редактировать результат и смешивать варианты. Возможно это будут нодовые редакторы или редакторы с инструментами, похожими на традиционные (например кистями), но с «нейронной логикой».
Очень быстро появится промпт (текстовый запрос к нейросети) язык второго уровня, более близкого к человеческому языку. Сейчас описания похожи на набор команд, не связаны логически и управлять ими сложно, а предсказуемости мало. Запросы станут более короткими и связными, возможно даже голосовыми, и уже они будут в себе содержать длинные и сложные комбинации слов обращающиеся непосредственно к нейросети. Возможно произойдет интеграция с биг датой и поисковыми запросами, чтобы предугадать вкусы того, кто генерирует изображение.
Роли и значение профессий также изменятся. Концепт артистов станет значительно меньше — один человек сможет обслуживать несколько проектов полностью. Концепт арт и иллюстрацию станут делать продюсера, гейм дизайнеры, маркетологи и 3d моделлеры. Вместо художественного поиска идей и наглядных материалов они будут генерироваться. Со временем в каждой компании будут свои нейросети, обученные под специфические задачи на материалах, созданных компанией. Ценность отдельных артов самих по себе и сейчас уже не очень высока, в дальнейшем она упадет еще сильнее. Важным будет только продукт, в котором этот арт используется.
Резюмируя
Никто не «умрет», никого нейронные сети не заменят. Они просто вынудят нас осваивать их и использовать. Для кого-то новые инструменты станут тяжелым испытанием на карьерном пути и вызовом, а другим откроют дорогу в мир, который до этого был недоступен.
С азартом наблюдаю за развитием этой ниши и уверен, через 5 лет мы не узнаем нашу индустрию. Нейронные сети открывают огромные возможности. Безусловно они будут развиваться все быстрее и быстрее, наверняка мы еще застанем момент, когда будем сами по запросу, а может даже настроению генерировать визуальный ряд видеоигр, в которые мы будем играть через 30–40 лет. А может и не только визуальный ряд, но и геймплей и целые миры. Если, конечно, доживем ;)
* Все изображения представленные в статье я сгенерировал с помощью Stable Diffusion без каких либо доработок и изменений