Стартап из Тайваня заявил о запуске ИИ-ускорителя на «устаревших» чипах, способного локально запускать модели на 700 млрд параметров

Тайваньская компания Skymizer представила необычный ИИ-ускоритель HTX301, который, по утверждению разработчиков, способен запускать большие языковые модели размером до 700 млрд параметров на одной PCIe-карте. При этом устройство использует не современные техпроцессы и дорогую высокоскоростную память HBM, а сравнительно старые 28-нм чипы и стандартную память LPDDR4/LPDDR5.

Главная ставка Skymizer — не на максимальную вычислительную мощность, а на объём памяти и энергоэффективность. В одну карту HTX301 компания встроила до 384 ГБ памяти, распределённых между шестью специализированными чипами HyperThought HTX301. Всё устройство потребляет около 240 Вт — значительно меньше, чем современные ускорители Nvidia и AMD аналогичного класса.

Компания заявляет, что карта способна выдавать до 30 токенов в секунду при работе с гигантскими моделями и до 240 токенов в секунду на более компактных Llama2 7B. Для этого используются специальные алгоритмы сжатия весов и KV-кэша, которые, по словам разработчиков, позволяют HTX301 превосходить open-source-движок llama.cpp на 9–17,8%.

Источник: Wccftech

Skymizer утверждает, что её решение устраняет одну из главных проблем корпоративного ИИ — необходимость строить дорогую инфраструктуру с GPU-кластерами, сложным охлаждением и огромным энергопотреблением. HTX301 рассчитан на установку в обычные серверы с воздушным охлаждением без модернизации дата-центров.

Разработчики также делают ставку на локальный запуск ИИ-моделей внутри компаний. По их мнению, это позволит избежать утечек данных, зависимости от облачных сервисов и непредсказуемых расходов на вычисления.

На фоне современных ускорителей заявление Skymizer выглядит особенно необычно. Например, PCIe-карта AMD Instinct MI350P использует 144 ГБ памяти HBM3E и потребляет заметно больше энергии, а Nvidia RTX PRO 6000 Blackwell требует около 600 Вт. Тайваньский стартап фактически пытается доказать, что для ИИ-инференса критически важны не только «сырые» терафлопсы, но и архитектура памяти вместе с эффективной работой с моделями.

Впрочем, пока все показатели HTX301 существуют только в презентациях компании. Независимые тесты карты должны пройти на выставке Computex 2026 в начале июня. Именно они покажут, действительно ли Skymizer удалось создать дешёвую альтернативу ускорителям Nvidia и AMD — или HTX301 пополнит длинный список амбициозных ИИ-стартапов, не сумевших подтвердить собственные обещания.

©  iXBT