Представлена Llama 4: самая большая модель Meta*06.04.2025 21:01

Логотип LlamaИсточник: Meta*

Meta* представила новое поколение своих ИИ-моделей — семейство Llama 4, которое знаменует значительный прорыв в области искусственного интеллекта. Новые модели обладают нативной мультимодальностью, позволяющей работать с текстом, изображениями и видео в рамках единой архитектуры.

Три модели для разных задач

В семейство Llama 4 входят три основные модели, каждая со своими особенностями:

Информация о новых моделяхИсточник: Meta*

Llama 4 Scout

Scout — компактная модель с 17 миллиардами активных параметров и 109 миллиардами общих параметров. Ключевая особенность Scout — рекордное контекстное окно в 10 миллионов токенов, что примерно в 80 раз больше, чем у предыдущей версии Llama 3 (128 тысяч токенов). Это позволяет модели обрабатывать огромные объемы информации — целые книги, технические документации или многочасовые диалоги за один раз.

Llama 4 ScoutИсточник: Meta*

Scout может работать на одном GPU NVIDIA H100, что делает ее доступной для широкого круга разработчиков. Модель поддерживает 12 языков и превосходит аналоги сопоставимого размера, включая Gemma 3 и Gemini 2.0 Flash-Lite.

Llama 4 Maverick

Maverick также имеет 17 миллиардов активных параметров, но использует 128 экспертов и содержит в общей сложности 400 миллиардов параметров. Контекстное окно составляет 1 миллион токенов. Модель превосходит GPT-4o и Gemini 2.0 в задачах кодирования, рассуждения, многоязычности, обработки длинного контекста и анализа изображений.

Llama 4 MaverickИсточник: Meta*

Экспериментальная чат-версия Maverick набрала 1417 ELO на платформе LMArena, что является высоким показателем в своем классе.

Llama 4 Behemoth

Behemoth — самая мощная модель в линейке с 288 миллиардами активных параметров и около 2 триллионов общих параметров. По заявлению Meta*, Behemoth превосходит GPT-4.5 в областях STEM.

Llama 4 BehemothИсточник: Meta*

Эта модель пока находится в стадии обучения и не выпущена публично, но уже служит «учителем» для своих меньших собратьев в процессе обучения.

Технологические инновации

Все модели Llama 4 используют архитектуру Mixture of Experts (MoE), которая повышает вычислительную эффективность, активируя только необходимые компоненты модели для конкретных задач. Например, Maverick содержит 400 миллиардов параметров, но использует только 17 миллиардов активных параметров через 128 экспертов.

Сравнение Llama 4 Maverick с другими моделямиИсточник: LMArena

Другая ключевая инновация — «ранняя интеграция» (early fusion), позволяющая объединять токены текста и изображений в единую модельную структуру. Это дает возможность предварительно обучать модель на больших объемах немаркированных текстов, изображений и видео.

Доступность и применение

Scout и Maverick уже доступны на Llama.com и через партнеров разработчиков, включая платформу разработки ИИ Hugging Face. Кроме того, ИИ-ассистент, интегрированный в WhatsApp, Messenger и Instagram, уже обновлен для использования Llama 4 в 40 странах.

Компания планирует рассказать о будущих моделях ИИ и планах развития продуктов на конференции LlamaCon, которая состоится 29 апреля. А уже сейчас можно ознакомиться с прогнозами о будущем ИИ от исследователей Google DeepMind. Рассказали о них в статье.

*Meta признана в России экстремистской организацией и запрещена на территории РФ