DeepSeek запустил мощный генератор изображений Janus Pro
Стартап DeepSeek, который в последние дни находится на первых строчках мировых СМИ, а одноименный чат-бот занимает топ-чарты в магазинах приложений, запустил новую ИИ-модель. Называется она Janus Pro 7B и служит для генерации изображений. Модель умеет как анализировать имеющиеся картинки, так и создавать новые согласно заданным описаниям. Новинка способна составить мощную конкуренцию DALL-E от OpenAI.
Китайская компания DeepSeek запустила генератор изображений Janus Pro 7B всего несколько дней назад. Первые пользователи уже успели отметить впечатляющие возможности модели, поскольку она может обрабатывать как промпты, так и готовые картинки. Таким образом, новинка предоставляет широкие возможности для творчества и креатива.
Возможности Janus Pro 7B оценил и известный ИИ-аналитик Роуэн Чунг. Он отметил, что модель действительно является мощным инструментом и по ряду показателей она превосходит устоявшиеся на рынке аналоги. Но, что самое важное, новый генератор изображений существенно улучшился относительно предыдущей версии Janus, что говорит о верном векторе развития. Отмечается, что в последней версии используется кодировщик SigLIP-Large-Patch16−384. С помощью него нейросеть разбивает изображения, анализирует их части, сохраняя детали для улучшения интерпретации и синтеза.
Согласно представленным графикам сравнения, Janus Pro 7B обходит в ряде бенчмарков Stable Diffusion (старая версия) и DALL-E 3. Единственной ложкой дегтя в этой истории является разрешение генерируемых изображений — 384×384 пикселя. Однако в будущем этот параметр также будет улучшен. Опробовать нейросеть можно по следующей ссылке.
Ранее о DeepSeek высказались эксперты в России. Рассказали, что они думают о китайском чат-боте.