«Сбер» обновил сервис генерации изображений Kandinsky до версии 2.1
Компания «Сбер» объявила об обновлении фирменного сервиса генерации изображений Kandinsky до версии 2.1. Среди ключевых улучшений — увеличение базы «скормленных» изображений, повышение детализации и возможность смешивания нескольких картинок в одну.
При переходе на версию Kandinsky 2.1 нейросеть дополнительно обучили на 170 миллионах пар «текст — изображение». После этого ей «скормили» ещё два миллиона специально отобранных пар качественных картинок, включающих изображения лиц, тексты и другие сложные для нейросетей объекты, чтобы повысить их качество при генерации. Кроме того, система была усовершенствована за счёт новой обученной модели автоэнкодера, которая используется в том числе в качестве декодера векторных представлений изображений, что кардинально улучшило генерацию изображений в высоком разрешении. Новая версия включает 3,3 миллиарда параметров вместо 2 миллиардов в Kandinsky 2.0.
Нейросеть позволяет не только генерировать изображения по текстовому описанию с применением естественной речи на 101 языке, но также с её помощью можно обрабатывать имеющиеся картинки, удалять или заменять элементы на них, совмещать несколько изображений в одно и формировать изображения в режиме бесконечного полотна (inpainting/outpainting).
«Обучая Kandinsky 2.1, мы учли мнения пользователей и реализовали смелую гипотезу, изучив самые передовые концепции. В результате мы разработали мощное универсальное решение для широкого круга задач на уровне лучших мировых аналогов. Оно открывает колоссальные возможности как для бизнеса, так и для населения. По сути, это ещё один важный шаг к AGI — сильному искусственному интеллекту. Думаю, у каждого найдётся задача для Kandinsky 2.1, и поэтому улучшенная модель, как и её предыдущая версия, находится в открытом доступе: протестировать её может любой желающий, причём бесплатно», — рассказал Александр Ведяхин, первый заместитель председателя правления Сбербанка.
Опробовать и оценить возможности обновлённой нейросети Kandinsky можно на официальном сайте. Кроме того, сервис доступен в виде Telegram-бота, а также на устройствах Sber через команду «Запусти художника» и в приложении «Салют».
Источник: sberbank.com
© 4PDA