ИИ генерирует изображения по тексту на обычном компьютере

05.09.2022, 17:48
Сегодня уже разработано много систем ИИ, которые могут генерировать изображение по текстовому описанию. Но все эти системы работают на суперкомпьютерах и не ко всем есть свободный доступ. Программисты из Университета Людвига-Максимилиана, Мюнхен разработали ИИ, которой работает на обычном компьютере. Модель доступна бесплатно. Теперь стать художником может каждый.
Владимир Губайловский
ИИ генерирует изображения по тексту на обычном компьютере
Изображение создано по тексту «Счастливые овощи ждут ужина». Ludwig Maximilian University of Munich

Пришло время почувствовать себя художником

Создавать изображения по текстовому описанию за считанные секунды с помощью обычной видеокарты и без суперкомпьютеров теперь возможно благодаря новой модели Stable Diffusion AI. Лежащий в основе алгоритм был разработан группой машинного зрения и обучения исследователями Университета Людвига-Максимилиана, Мюнхен.

«Даже для непрофессионалов, не наделенных художественным талантом и не имеющих специальных вычислительных ноу-хау и компьютерного оборудования, новая модель является эффективным инструментом, позволяющим компьютерам генерировать изображения по команде», — говорит ведущий разработчик Бьорн Оммер. Но и опытные художники могут использовать Stable Diffusion для быстрой реализации новых идей в графических набросках.

Исследователи убеждены, что такие инструменты на основе ИИ смогут расширить возможности творческого создания изображений, для которых мы привыкли использовать Photoshop. Ученые убеждены, что такие инструменты, как Stable Diffusion AI, способны изменить искусство рисунка также, как компьютерная обработка текста изменила письмо с помощью ручки или пишущей машинке.

Квинтэссенция миллиарда образов

В своем проекте ученые пользовались поддержкой стартапа Stability.Ai, на серверах которого обучалась модель ИИ. «Эта дополнительная вычислительная мощность и дополнительные обучающие примеры превратили нашу модель ИИ в один из самых мощных алгоритмов синтеза изображений», — говорит Бьорн Оммер.

Особенностью подхода является то, что при всей мощности обучаемой модели она настолько компактна, что работает на обычной видеокарте и не требует суперкомпьютера. С этой целью искусственный интеллект преобразует миллиарды обучающих изображений в модель ИИ размером всего в несколько гигабайт.

«Как только такой ИИ действительно поймет, что представляет собой автомобиль или какие характеристики типичны для художественного стиля пользователя, он уловит эти существенные черты и в идеале должен быть в состоянии создавать новые образцы так же, как ученики мастера могут создавать работать в его стиле», — объясняет Оммер. 

Модель Stable Diffusion была выпущена бесплатно под лицензией CreativeML Open RAIL-M, чтобы облегчить дальнейшие исследования и более широкое применение этой технологии.

©  Популярная Механика