Esperanto: не только язык, но и производительный 1000-ядерный RISC-V процессор для систем машинного обучения

ck_waioxu0hdlqjf-lgwvk73iga.jpeg


Постепенно в индустрии производства процессоров развиваются альтернативные архитектуры, на базе которых создают весьма примечательные чипы. Так, стартап Esperanto Technologies представил собственную версию RISC-V процессора, причем не обычного, а высокопроизводительного, предназначенного для работы с ИИ-системами и машинным обучением. Мы уже не раз писали об экспериментах в этой отрасли, давайте посмотрим, что это за новинка.

Немного об архитектуре


Что касается архитектуры RISC-V, то она основана на идее адаптировать создание конкретных микросхем с возможностью выбирать, какие расширения набора команд будут использоваться. В основе архитектуры — свободные система команд и, собственно, сама процессорная архитектура на базе концепции RISC.

Что касается ее особенности, то в описании архитектуры — около 50 стандартных инструкций. Если использовать расширения, можно получить дополнительные 53 инструкции.

Чипы на базе RISC-V стали выпускать не так давно — примерно с 2017 года, не считая всяких прототипов и лабораторных образцов. Начиная с 2018 года, RISC-V Foundation тесно сотрудничает с The Linux Foundation.

RISC-V отлично подходит для работы с приложениями с параллельными вычислениями. К ним, кроме всего прочего, относится машинное обучение, а также ИИ-системы. Именно поэтому сразу несколько компаний разрабатывают процессоры на базе RISC-V. Не сказать, что у всех все идет гладко, но есть и успешные примеры. Можно надеяться, что Esperanto станет одним из них.

Ну окей, так что это за процессор такой?


По словам разработчиков, чип отлично подходит для работы в сфере ИИ и машинного обучения.

Название модели — ET-SoC1 (Esperanto Technologies Supercomputer-on-Chip 1), ее разработчики называют AI Inference Accelerator. Появился процессор не вчера, разрабатывается он уже больше года, так что новинкой можно назвать чип условно. Но вот тестироваться сторонними компаниями он стал только сейчас. Из особенностей — 1088 энергоэффективных 64-разрядных ядер RISC-V общего назначения с модулями векторных/тензорных вычислений для оптимизации и ускорения операций, которые связаны с ИИ и машинным обучением. Кроме того, чип включает четыре высокопроизводительных ядра RISC-V, 160 млн байт встроенной SRAM-памяти (152 мегабайта), плюс интерфейсы для подключения flash-памяти и внешних модулей DRAM. Насколько известно, всего в ET-SoC1 23.8 млрд транзисторов.

8vkrezysptgchdj7qpqw3yctouu.png


Источник

Одно из достоинств новой разработки — высокая энергоффективность, то есть пониженное потребление энергии при очень высокой производительности. Понятно, что «каждый сверчок хвалит свой шесток, но разработчики утверждают, что создали самый быстрый на данный момент процессор такого типа на базе RISC-V архитектуры.

Максимальная эффективность чипа наблюдается при работе в рекомендательных системах на основе машинного обучения. Если сам процессор настолько хорош, как о нем рассказывают разработчики, то он сможет найти применение в системах гипермасштабируемых ЦОД крупнейших компаний мира. Но, конечно, для того, чтобы произошло, процессор необходимо протестировать — в «полевых условиях», а не лабораториях компании, которая его разработала. И этим уже занимаются — например, компания Samsung.

Если вы читаете наш блог, вас могут заинтересовать эти тексты:

→ Как оптимизировать траты на аренду инфраструктуры
→ Готовый реестр контейнеров — кому нужен и как использовать
→ Как мы запустили удаленный регион облака в Узбекистане


Что говорят представители Samsung


По их словам, чип действительно неплохо справляется с поставленными задачами. Команда тестировщиков из Samsung SDS заявила, что процессор демонстрирует высокую масштабируемость. В целом, об этом говорилось выше, когда мы обсуждали RISC-V, и по словам представителей Samsung, при увеличении количества чипов в системе обработки данных ее производительность быстро растет. Стоит отметить, что это далеко не всегда происходит с традиционными чипами — производительность системы даже с очень большим их количеством растет до определенного момента, после чего дальнейший рост либо очень сильно замедляется, либо и вовсе останавливается. Системы на базе нового чипа показывают же почти линейный рост производительности при масштабировании.

По результатам проведенных тестов оказалось, что ET-SoC1, показывая очень высокую производительность с такими моделями, как ResNet 50, DLRM и Tranformer, потреблял (из расчета на один процессор) всего 20 Вт.

ppmdbaktkvxkr4ufqfqrhutybrm.jpeg


Кроме Samsung, тестировали процессор и в Cambrian-AI Research. По словам представителей этой компании, показатели производительности процессора в ходе тестов продемонстрировали близкие к заявленным разработчиками результаты. Глава команды тестировщиков Карл Фрёйнд (Karl Freund) сообщил, что ядра RISC-V выполняют основную нагрузку, не перекладывая при этом матричные мультипликаторы на MAC-ядра или GPU.

Что дальше?


Положительные отзывы — это, конечно, хорошо, но до коммерческого использования чипа в среде крупных корпораций еще далеко. Сейчас компания Esperanto заявила, что приглашает новых партнеров к тестированию своего чипа для решения самых разных задач, а не только использованию его в рекомендательных системах. Программа тестирования дает возможность партнерам тестировать разные модели, типы данных и вычислительные системы вплоть до 32 кластеров.

До момента, пока на Esperanto не обратят внимание крупнейшие корпорации (что, в принципе, понемногу уже происходит), производителям ИИ-систем вроде Nvidia беспокоиться нечего. Но это только пока, ситуация может измениться в любой момент.

bsekunhbigg-cs-e7twinc69weg.png

© Habrahabr.ru