Alibaba представила свою флагманскую модель Qwen-3-Max: конкурент GPT-5

Qwen
Вышла новая модель QwenИсточник: Qwen

Китайская корпорация Alibaba запустила флагманскую языковую модель, которая бросает вызов американским лидерам в сфере искусственного интеллекта. Система получила более триллиона параметров и была обучена на массиве данных объёмом 36 триллионов токенов.

Разработчики использовали архитектуру Mixture of Experts, которая активирует только нужные блоки сети для каждой задачи, экономя вычислительные ресурсы. Контекстное окно достигает одного миллиона токенов, что позволяет анализировать целые кодовые базы без разделения текста. Благодаря оптимизации PAI-FlashMoE пропускная способность при обучении выросла на 30% по сравнению с предыдущей версией.

Сравнение характеристик новой модели Qwen
Сравнение характеристик новой модели QwenИсточник: Qwen

Инженеры стабилизировали процесс обучения методом global-batch load balancing loss, что исключило сбои и перезапуски во время тренировки. Технология ChunkFlow обеспечивает трёхкратное ускорение обработки длинных текстов.

В рейтинге LMArena модель Qwen3-Max-Instruct заняла третье место, уступив только Claude Opus 4.1 Thinking, Gemini 2.5 Pro и OpenAI GPT-5 High, но опередив базовую версию GPT-5. В тесте SWE-Bench Verified, проверяющем способности программирования, система набрала 69,6 балла. В испытании Tau2-Bench для ИИ-агентов результат составил 74,8 балла, превзойдя DeepSeek V3.1 и Claude Opus 4.

Модель демонстрирует заметный прогресс в понимании сложных инструкций, рассуждениях и работе с узкоспециализированными областями знаний. Система обеспечивает более высокую точность в задачах математики, программирования, логики и науки.

Сравнение характеристик новой модели Qwen
Сравнение характеристик новой модели QwenИсточник: Qwen

Alibaba анонсировала перспективную версию Qwen-3-Max-Thinking, которая находится в стадии обучения. В пробных тестах она показала стопроцентный результат в задачах на рассуждение, включая AIME-25 и HMMT. Эта версия уже достигла уровня GPT-5-Pro и Grok 4 Heavy в бенчмарках.

Базовая версия Qwen3-Max-Base доступна бесплатно через приложение или сайт Qwen. На мобильных платформах iOS и Android модель предлагается в качестве стандартной. Пользователи могут активировать её вручную через меню выбора модели.

Также ранее стало известно, что GigaChat научили создавать презентации. Подробности в статье.

Поделиться

©  HI-TECH@Mail.Ru