Google представила ИИ-редактор для создания фантастических химер

image

В Google AI продемонстрировали Chimera Painter, модель машинного обучения (ML), которая может рендерить изображения химер и других игровых существ по исходному контуру. Chimera Painter добавляет элементы и текстуры к контуру, сегментированному метками частей тела, такими как «крылья» или «когти», когда пользователь нажимает кнопку «преобразовать».

При разработке модели машинного обучения в Google создали прототип цифровой карточной игры, основанный на концепции слияния существ в гибриды, которые затем могут сражаться друг с другом. В этой игре игрок начал бы с карт реальных животных (например, аксолотля или кита) и мог бы сделать их более могущественными путем комбинации (создавая химеру аксолотль-кит).

Поскольку целью было создание высококачественных изображений карт существ, разработчики экспериментировали с генеративными состязательными сетями (GAN). GAN объединяют две сверточные нейронные сети друг против друга: сеть генератора для создания новых изображений и сеть дискриминатора, чтобы определить, являются ли эти изображения образцами из обучающего набора данных (в данном случае изображениями, созданными художником). В варианте условного GAN, который был применен, генератор принимает отдельные входные данные для управления процессом создания изображения.

Чтобы обучить GAN, был создан набор данных из полноцветных изображений с однотипными очертаниями существ, адаптированными из трехмерных моделей. Очертания характеризовали форму и размер и обеспечивали карту сегментации, которая идентифицировала отдельные части тела. После обучения модели ей было поручено создать многовидовые химеры на основе схем, предоставленных художниками. Затем в Chimera Painter была включена самая эффективная модель.

image

Выше показаны некоторые образцы, сгенерированные с помощью модели.

image Проблема с использованием GAN для создания химер заключалась в возможности потери анатомической и пространственной когерентности при рендеринге тонких или малоконтрастных частей изображений, несмотря на то, что они имеют большое значение для восприятия (глаз, пальцев, перекрывающих друг друга частей тела с похожей текстурой). Создание химер потребовало нового нефотографического набора данных в стиле фэнтези с уникальными характеристиками, такими как драматическая перспектива, композиция и освещение.

Существующие репозитории иллюстраций не подходили для использования в качестве наборов данных для обучения модели.

Чтобы решить эту проблему, был разработан новый полуавтоматический подход под руководством художников для создания набора данных из трехмерных моделей существ.

Художники создавали или получали набор трехмерных моделей существ, по одной для каждого необходимого типа (например, гиен или львов). Затем они создали два набора текстур, которые были наложены на 3D-модель с помощью Unreal Engine: один с полноцветной текстурой (левое изображение, ниже), а другой с плоскими цветами для каждой части тела (например, головы, ушей, шеи, и т. д.), называемую «картой сегментации» (правое изображение ниже).

image

Этот второй набор сегментов частей тела был предоставлен модели во время обучения, чтобы гарантировать, что GAN узнает о структуре, формах, текстурах и пропорциях отдельных частей тела для различных существ.

3D-модели существ были помещены в простую 3D-модель с использованием Unreal Engine. Затем набор автоматических скриптов берет эту трехмерную сцену и интерполирует между различными позами, точками обзора и уровнями масштабирования для каждой из трехмерных моделей, создавая полноцветные изображения и карты сегментации, которые сформировали набор обучающих данных для GAN.

Используя этот подход, удалось сгенерировать более 10 тысяч пар изображение+карта сегментации для каждой трехмерной модели существа, сэкономив художникам миллионы часов времени по сравнению с созданием таких данных вручную (примерно по 20 минут на изображение).

У GAN было много различных гиперпараметров, которые можно было настраивать, что приводило к разному качеству выходных изображений. Чтобы лучше понять, какие версии модели были лучше других, художникам были предоставлены образцы различных типов существ, созданных с помощью этих моделей, и их попросили выделить несколько лучших примеров. Отзывы об ощущении глубины, стиле в отношении текстур и реализме лиц и глаз использовали как для обучения новых версий модели уже после того, как она сгенерировала сотни тысяч изображений. Это позволило выбрать лучшее изображения из каждой категории существ.

GAN настроили для этой задачи, сосредоточив внимание на компоненте функции потери восприятия. Он вычисляет разницу между двумя изображениями с использованием функций, извлеченных из отдельной сверточной нейронной сети (CNN), которая ранее была обучена на миллионах фотографий из набора данных ImageNet. Свойства извлекаются из разных слоев CNN, и к каждому из них применяется вес, который влияет на их вклад в окончательное значение потерь. Ниже приведены несколько примеров из GAN, обученных с разными весами воспринимаемых потерь.

image

Демоверсия Chimera Painter позволит художникам итеративно работать с моделью, а не рисовать десятки похожих существ с нуля. Она также позволяет загружать контур существа, созданный во внешней программе, такой как Photoshop.

См. также: «Графические войны #1: лагающее пиксельное XX столетие»

© Habrahabr.ru