Как устроен будущий лидер Top500 — суперкомпьютер El Capitan
В августе прошлого года министерство энергетики США и производитель суперкомпьютеров Cray объявили о создании суперкомпьютера El Capitan. Планируется, что он будет установлен в Ливерморской национальной лаборатории им. Лоуренса в Калифорнии и начнёт работу в 2023 году. 4 марта министерство и лаборатория рассказали об устройстве будущего лидера Top500.
Ведомство и научный центр сообщили, что центральные и графические процессоры суперкомпьютера будет предоставлено компанией AMD — AMD EPYC и AMD Radeon Instinct соответственно. Кроме того, в сравнении с изначальными планами изменилась ожидаемая производительность El Capitan — она составит два экзафлопса, хотя изначально предполагалось, что она будет 1,5. Благодаря этому суперкомпьютер обгонит предыдущего заочного лидера Top500 Frontier, который также разрабатывается министерством энергетики США и появится в 2021 году. Отмечается, что El Capitan будет потреблять около 40 МВт.
Новый суперкомпьютер очень похож на Frontier с аппаратной точки зрения, пишет AnandTech. Это неудивительно, поскольку подрядчиком для них обоих выступает Cray. Конструкция суперкомпьютера Aurora базируется на базе унифицированных кластерных систем Cray Shasta; их количество не называется, однако их, вероятно, будет больше, чем во Frontier со 100 системами.
El Capitan будет оснащён процессорами AMD, использующими архитектуру Zen 4, которая ещё находится в разработке. Кроме того, компания пообещала, что будет использовать интерконнект Infinity Fabric 3.0 для связи между кристаллами в дизайне чиплетов. А вот о графических процессорах, которые будут использоваться в El Capitan, пока практически ничего не известно — Cray лишь сообщила, что они будут следующего поколения, а также смогут поддерживать вычисления смешанной точности для ускорения решения задач глубокого обучения. Работать El Capitan будет в конфигурации 4:1 — четыре GPU на каждый CPU. При этом узлы Infinity Fabric 3.0 будут иметь унифицированную память для центральных и графических процессоров. Связаны между собой они будут с использованием технологии Slingshot от Cray — пропускная способность соединения составит 200 Гбит/с.
В первую очередь суперкомпьютер предназначен для использования Национальной администрацией по ядерной безопасности (NNSA), которая моделирует состав ядерного вооружения с помощью суперкомпьютеров. Отмечается, что повышение производительности по сравнению с изначальными планами произошло как раз по инициативе ведомства — в Cray заявили, что сначала определили архитектуру суперкомпьютера на основе систем Shasta, а только затем начали выбор моделей GPU и CPU для El Capitan. Благодаря этому и удалось достичь производительности в два экзафлопса. Кроме того, его планируется использовать для поиска лекарства от рака и причин мутаций белков RAS человека, вызывающих онкологические заболевания. El Capitan займёт место суперкомпьютера Sierra в Ливерморской лаборатории, и станет в 16 раз мощнее него. Стоимость нового суперкомпьютера составит $400 млн.