xAI Илона Маска выпустила флагманскую голосовую модель Grok Voice Think Fast 1.0, которая опережает конкурентов

xAI представила Grok Voice Think Fast 1.0 — новую флагманскую голосовую модель, которая теперь доступна через API. Это самый мощный голосовой агент компании на сегодняшний день, значительно превосходящий предыдущие версии и конкурентов в реальных сценариях.

Этот голосовой агент ориентирован на клиентский сервис, телемаркетинг и сложные сценарии. Модель создана для реального бизнеса и уже применяется в службе поддержки Starlink.

Изображение Grok

Ключевая особенность — полноценный дуплексный режим с минимальной задержкой. Grok Voice Think Fast 1.0 уверенно обрабатывает перебивания, акценты, фоновый шум. По результатам независимого бенчмарка t-Voice Bench новая модель набрала 67,3%, что почти в два раза выше конкурентов: Gemini 3.1 Flash Live (43,8%) и GPT Realtime 1.5 (35,3%).

Технически модель работает с более чем 25 языками, включая русский, и демонстрирует высокую точность при сборе структурированных данных — email, адреса, номера счетов и так далее. Это позволяет вести естественный диалог даже в шумных условиях и с сильными акцентами.

Фактически xAI сделала серьёзный шаг к замене традиционных колл-центров. Голосовой ИИ теперь не просто отвечает, а полноценно ведёт сложный разговор на уровне человека. Модель уже доступна для интеграции в реальные продукты.

iXBT прочитано 6623 раза