Обновлён рейтинг 50 самых производительных суперкомпьютеров СНГ

image
Суперкомпьютер «Червоненкис» в дата-центре Яндекса в Сасове, Рязанская область.

Научно-исследовательский вычислительный центр Московского государственного университета имени М.В. Ломоносова и Межведомственный суперкомпьютерный центр Российской академии наук опубликовали 37 редакцию (от 26.09.2022) списка топ-50 самых мощных компьютеров СНГ. В первой пятёрке рейтинга три суперкомпьютера «Яндекса» («Червоненкис», «Галушкин» и «Ляпунов») и два «Сбера» (Christofari Neo и Christofari).
fjkagj4gxmtuhmxqxnnfgssqb-k.png

Суммарная производительность всех систем на тесте Linpack за полгода увеличилась с 85,1 петафлопс до 85,4 петафлопс. Суммарная пиковая производительность систем списка составила 120,6 петафлопс (120,2 петафлопс в предыдущей редакции списка). Всего за полгода в списке появилось три новых суперкомпьютера, занявшие 20 место (ФГБОУ ВО Марийский государственный университет), 39 место (Тульский Промышленный Технопарк) и 45 место (Pangea PD Cluster).

Для попадания в текущую редакцию списка топ-50 потребовалась производительность на тесте Linpack 83,9 терафлопс (77,5 терафлопс в предыдущей редакции).

В 41 из 50 суперкомпьютеров данной редакции в качестве основных процессоров установлены решения от Intel. Число гибридных суперкомпьютеров, использующих для вычислений ускорители, выросло за полгода с 32 до 34.

Суперкомпьютеры «Яндекса» названы в честь советских и российских учёных, которые внесли вклад в теорию машинного обучения и компьютерные науки. Система «Ляпунов» введена в эксплуатацию в декабре 2020 года, а «Червоненкис» и «Галушкин» — в июне 2021 года. Суперкомпьютеры «Яндекса» построены на базе процессоров AMD EPYC и графических ускорителей Nvidia A100 с интерконнектом InfiniBand на базе коммутаторов Mellanox. В их основе лежит архитектура Nvidia HGX A100, оптимизированная для задач машинного обучения, которые стоят перед «Яндексом». Использование данной архитектуры позволило разработчикам систем увеличить размер кластера и обучать самые большие ML-модели примерно вдвое быстрее, чем при стандартной архитектуре.

Самый мощный из них «Червоненкис», он имеет пиковую производительность 21,53 петафлопса. У «Галушкина» 16,02 петафлопса, а мощность «Ляпунова» составляет 12,81 петафлопса. «Яндекс» задействует свои суперкомпьютеры для обучения нейросетей. Например, благодаря им сервис «Яндекс Переводчик» точнее и быстрее переводит тексты, картинки и видео, а «Яндекс Директ» отбирает более релевантную рекламу. Сервису «Яндекс Поиск» языковые модели из семейства YaLM (Yet another Language Model), вдохновлённые GPT-3 от компании Open AI, помогают составлять и ранжировать быстрые ответы. Суперкомпьютеры «Яндекса» научили голосовой помощник «Алису» поддерживать живой диалог с пользователями.

В настоящий момент «Червоненкис», «Галушкин» и «Ляпунов» занимают 22 место, 40 место и 43 место, соответственно, в рейтинге топ-500 суперкомпьютеров мира. Суперкомпьютер «Сбера» Christofari Neo там на 46 месте, а Christofari на 80 месте. Всего в рейтинге топ-500 суперкомпьютеров мира находятся только 7 систем из России.

11 ноября 2021 года «Сбер» представил свой второй суперкомпьютер — Christofari Neo. Его эффективная производительность в двойной точности составляет почти 12 петафлопс (11,95 петафлопс). Вторая модель суперкомпьютера «Сбера» создана на базе технологий Nvidia, в его основе графические процессоры Nvidia A100 с 80 ГБ памяти, причём там их установлено более 700 штук. «Сбер» уточнил, что тензорные ядра A100 обеспечивают высочайшую производительность в задачах ИИ, а 80 ГБ памяти позволяют работать с большими ИИ-моделями и массивами данных.

Первый суперкомпьютер «Сбера» Christofari был запущен в конце 2019 года также в партнёрстве с компанией Nvidia на основе высокопроизводительных узлов Nvidia DGX-2, оснащённых вычислительными ускорителями Tesla V100. В начале его эксплуатации производительность первого суперкомпьютера «Сбера» в проведённых тестах достигала 6,669 петафлопс (пиковая производительность 8,789 петафлопс). Описание состава Christofari: Nvidia DGX-2, Xeon Platinum 8168 24C 2.7GHz, Mellanox InfiniBand EDR, Nvidia Tesla V100, рабочих ядер: 99 600.

Введённые в конце августа санкции США по запрету Nvidia и AMD поставлять в РФ высокопроизводительные чипы и оказывать поддержку по текущим поставкам затронут развитие и масштабирование систем суперкомпьютеров и вычислительных кластеров облачных сервисов «Яндекса» и «Сбера». Высокопроизводительные системы этих российских компаний созданы на базе технологий и оборудования Nvidia, включая запрещённые теперь к поставке графические ускорители с тензорными ядрами A100 и H100.

Эксперты отрасли считают, что от запрета на экспорт в Россию чипов Nvidia и AMD пострадают компании, которые использовали принцип «если у нас не хватает вычислительной мощности, купим ещё немного GPU Nvidia». Представитель «Яндекса» заявил СМИ, что сейчас сервисы и IT-инфраструктура компании работают в штатном режиме. Представители «Сбера» отказались от комментариев.

В начале июля Nvidia прекратила продавать и продлевать лицензии на специальное программное обеспечение для облачного гейминга, в том числе это затронуло популярные у корпоративных заказчиков и российских игровых сервисов решения на технологии Nvidia GRID.

© Habrahabr.ru