«Сбер» представила Kandinsky 2.2
Компания «Сбер» представила новую версию нейросети Kandinsky 2.2. По словам разработчиков, с помощью генеративной модели можно создавать фотореалистичные изображения с высоким разрешением и изменять соотношение сторон при генерации. Об этом рассказали информационной службе Хабра в пресс‑службе IT‑компании.
Из нововведений нейросети:
— увеличился прирост качества при создании портретов. Для дообучения нейросети использовался датасет в размере 1,5 млрд пар «текст — изображение», что на 300 млн больше, чем в предыдущей версии — Kandinsky 2.1.
— модель научилась генерировать стикеры, из которых можно собирать полноценные стикерпаки в Telegram;
— бот Kandinsky 2.2 теперь способен изменять по текстовому описанию отдельные объекты или элементы на изображениях, сохраняя композицию исходной иллюстрации. Это стало возможным благодаря внедрению в модель специального структурного блока управляемых изменений — ControlNet;
— она начала понимать запросы на русском и английском языках;
— умение рисовать в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, дорисовывать недостающие части картинки (inpainting), создавать картины в режиме бесконечного полотна (outpainting).
Как и предыдущая версия, Kandinsky 2.2 находится в открытом доступе и её можно протестировать на промостранице модели, на платформе FusionBrain.AI, в Telegram‑боте, в боте ВКонтакте, в мобильном приложении Салют и при помощи команды «Запусти художника» на умных устройствах Sber. Кроме того, модель доступна на платформе ML Space в хабе предобученных моделей и датасетов DataHub.
Нейросеть была разработана и обучена исследователями Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.