ИИ генерирует (страшные) картинки по текстовым описаниям20.08.2018 12:35

Искусственный интеллект AttnGAN создает изображения по текстовому описанию. Получается пока не очень: в большинстве случаев получаются очень абстрактные изображения, но иногда по картинке можно (очень приблизительно) понять, что имелось ввиду. Вот это, например, изображение по запросу «красивая молодая женщина»:

а это — «кот» (мы пробовали несколько раз, и каждый раз алгоритм выдает что-то полосатое — возможно, учился на полосатых котах):

Технологии
Марсоход «Кьюриосити» наткнулся на таинственное препятствие
Технологии
Honda HA-420 HondaJet: первый самолёт Honda

AttnGAN создали разработчики из Центра глубокого обучения Microsoft; описание алгоритма опубликовано в репозитории arXiv.org. Лучшие результаты получаются, когда запросы соответствуют тематике массива изображений, на которых обучали алгоритм — когда в него загрузили много изображений птиц, он стал сносно генерировать птиц, но когда алгоритм учится на массивах картинок более разнообразной тематики, он теряет сноровку.

Tao Xu et al., 2018

Зато по‑прежнему неплохо разбирается во фруктах (запрос «банан и персик»):

Больше всего редакцию «Популярной механики» напугало изображение человека в красном, сгенерированное по запросу «Огонь иди со мной» — в статье не упоминается об обучении алгоритма на кадрах из «Твин Пикса»:

Поиграть с демо-версией ИИ можно тут — правда, понимает она только английский язык. Демо-версию разработал Кристобаль Валенсуэла из Нью-Йоркского университета, участник проекта Runway, цель которого — исследование творческих способностей искусственного интеллекта.