Илон Маск представил Grok 4: свою самую мощную нейросеть

Илон Маск выступает
Илон Маск на презентации Grok 4Источник: X/Twitter

Компания xAI выпустила четвертую версию своего искусственного интеллекта, который теперь способен решать задачи на уровне докторов наук. Новинка получила две модификации: базовую и усиленную Heavy, которая работает по принципу команды из нескольких ботов.

Главное достижение — результат 50,7% в тесте Humanity«s Last Exam при максимальном использовании вычислительных ресурсов. Этот экзамен содержит тысячи вопросов по математике, естественным наукам и гуманитарным дисциплинам. Для сравнения: предыдущий лидер Gemini 2.5 Pro от Google набирал только 22%.

Результаты тестов Grok 4 график
Результаты тестов Grok 4Источник: X/Twitter

Без дополнительных инструментов показатель снижается до 25,4%, но все равно превышает результаты OpenAI o3 (21%). Версия Heavy с инструментами достигает 44,4% против 26,9% у Gemini с аналогичными возможностями.

Ключевая особенность — встроенная система командной работы. Несколько виртуальных помощников решают одну задачу параллельно, затем сравнивают ответы и выбирают лучший вариант. Такой подход позволяет избежать ошибок, характерных для работы одного алгоритма.

Результаты тестов Grok 4 скриншот
Результаты тестов Grok 4Источник: X/Twitter

Система научилась эффективно пользоваться браузером и интерпретатором кода. Эти навыки интегрированы на этапе обучения, а не добавлены позже как внешние модули.

Обновленный voice mode работает быстрее и получил эмоциональную окраску. Бот умеет шептать, петь, менять интонации в зависимости от контекста беседы. Это приближает общение с ИИ к естественному человеческому диалогу.

Heavy-версия показала 100% результат в тесте AIME 2025 — математической олимпиаде для старшеклассников. Также система установила рекорд в ARC-AGI-2 (16,2%), тесте на распознавание визуальных паттернов, почти вдвое превзойдя ближайшего конкурента Claude Opus 4.

Результаты тестов Grok 4 особенности
Результаты тестов Grok 4Источник: X/Twitter

Доступ к базовой версии Grok 4 стоит 30 долларов в месяц (2400 рублей). Heavy-модификация требует подписки SuperGrok Heavy за 300 долларов в месяц (24 000 рублей) — самый дорогой тариф среди крупных ИИ-провайдеров. Подписчики получают ранний доступ к новым функциям: модель для программирования (август), мультимодальный агент (сентябрь) и генератор видео (октябрь).

Запуск происходит на фоне противоречий. Автоматический аккаунт Grok в X недавно публиковал антисемитские комментарии, что заставило компанию временно ограничить его активность. Руководство xAI удалило из системных инструкций пункт о «политически некорректных» высказываниях.

Несмотря на технические достижения, репутационные риски могут осложнить продвижение среди корпоративных клиентов, которые ценят надежность и предсказуемость ИИ-решений.

Также ранее стало известно, что один из главных игроков на рынке нейросетей достиг отметки 4 трлн долларов капитализации. Подробности в статье.

Поделиться

©  HI-TECH@Mail.Ru