DeepSeek задержала выпуск новейшую модель V4 ради адаптации под китайские чипы Huawei

Китайская DeepSeek задержала выпуск новой модели V4, сосредоточившись на переходе на китайские чипы Ascend от Huawei.

По данным Bloomberg, компания потратила несколько месяцев на глубокую переработку программного стека, чтобы не просто обеспечить совместимость, а добиться максимальной производительности на новой аппаратной базе.

Интеграция китайских ускорителей в существующую инфраструктуру обучения и вывода моделей оказалась сложной задачей. Разработчикам пришлось адаптировать систему под специфические особенности архитектуры, чтобы добиться стабильной, масштабируемой и удобной в эксплуатации работы. Такой подход должен позволить постепенно заменить импортные решения в ключевых вычислительных сценариях.

Изображение Grok

Несмотря на задержку, в прошлую пятницу компания DeepSeek представила предварительную версию своей долгожданной модели V4, адаптированной для однокристальных систем Huawei. V4 выпускается в двух версиях: более мощной и дорогой Pro, а также более легкой и дешевой Flash-версии. В тестах на знание мировых данных версия Pro превосходит другие модели с открытым исходным кодом, уступая лишь Google Gemini-Pro-3.1.

Сегодня стало известно, что DeepSeek предлагает разработчикам 75-процентную скидку на свою недавно представленную модель искусственного интеллекта DeepSeek-V4-Pro до 5 мая.

©  iXBT