DeepSeek готовит новую модель V4 без Nvidia: ставку полностью делают на чипы Huawei

Китайская DeepSeek работает над новой языковой моделью V4, и, по данным источников The Information, она может полностью перейти на аппаратную платформу Huawei.

Речь идет не просто о частичном использовании — модель, как утверждается, будет целиком построена на фирменных ИИ-чипах компании. Такие компании, как Alibaba Group, ByteDance и Tencent, недавно заказали оптом чипы Ascend 950PR.

Ожидается, что модель DeepSeek V4 будет использовать архитектуру с почти триллионом параметров и, вероятно, сотни тысяч чипов Ascend 950PR.

Дополнительные сведения показывают, что DeepSeek в течение нескольких месяцев сотрудничала с Huawei и Cambricon (китайским производителем микросхем) для переписывания и тестирования основных компонентов кода модели.

Ни DeepSeek, ни Huawei пока не прокомментировали эту новость. Но существует большая вероятность, что эта информация правдива. DeepSeek уже давно использует чипы Ascend в своих моделях искусственного интеллекта. Поэтому не будет сюрпризом, если этот стартап в области ИИ полностью перейдет на Huawei на фоне конфликтов вокруг поставок продукции Nvidia в Китай.

Ожидается, что DeepSeek V4 будет выпущена в ближайшие недели. Кроме того, компания работает над еще двумя новыми версиями, которые могут появиться позже в этом году.

DeepSeek — это передовая китайская платформа искусственного интеллекта и серия больших языковых моделей (LLM), разработанная стартапом из Ханчжоу, которая позиционируется как мощный конкурент ChatGPT. Она специализируется на написании кода, математических вычислениях, логических рассуждениях и генерации текста, включая поддержку русского языка.

©  iXBT