Fujitsu построит суперкомпьютер для исследования искусственного интеллекта
На прошлой неделе японский Национальный институт передовой промышленной науки и технологии (AIST) выбрал компанию Fujitsu для создания суперкомпьютера ABCI (AI Bridging Cloud Infrastructure). Он станет платформой для исследований в области искусственного интеллекта, робототехники, автопилотируемых автомобилей и медицины.
Предполагается, что ABCI будет выполнять операции с двойной точности со скоростью 37 петафлопсов. Компьютер начнет работу в 2018 году и станет самым быстрым в Японии.
/ Flickr / NASA Goddard / CC
Что внутри
Система будет использовать 1088 серверов Fujitsu Primergy CX2570, в каждом из которых по 2 процессора Intel Xeon Gold и 4 графических процессора NVIDIA Tesla V100. Для ускорения локального ввода/вывода суперкомпьютер снабдят NVMe-картами Intel SSD DC P4600, которые работают с использованием технологии 3D NAND.
Архитектура NVIDIA Volta и ускоритель Tesla V100 требуют жидкостного охлаждения, потому что во время работы они нагреваются сильнее других элементов. Чтобы исправить ситуацию, Fujistu используют противоречивый подход — охлаждение горячей водой.
Этот метод помогает операторам задействовать меньше чиллеров или вовсе их не использовать. В 2015 году компания Fujitsu заявила, что серверы Primergy уменьшили стоимость охлаждения в два раза. Коэффициент PUE серверов был равен 1,06. Достигнуть этого удалось с помощью технологии жидкостного охлаждения «прямо к чипу» (direct-to-chip).
Ещё одно решение для ABCI — охлаждение на уровне стойки: 50 кВт жидкостного охлаждения и 10 кВт воздушного. На процессорах установлены блоки охлаждения, чтобы поддерживать температуру и удалять избытки тепла. Схему охлаждения вы можете найти здесь.
Где поставят
Бюджет проекта ABCI составляет 172 миллиона долларов. Десять миллионов из этой суммы пойдет на строительство нового ЦОДа для системы, который разместится в кампусе Токийского университета. Максимальная мощность ЦОДа составит 3,25 МВт, а производительность охлаждающей установки — 3,2 МВт. Пол в ЦОДе будет из бетона. Стартовое количество стоек — 90 штук: 18 для хранения данных и 72 для выполнения вычислительных задач.
Строительство ЦОДа началось этим летом, а саму систему ABCI запустят в 2018 году.
У кого больше петафлопсов
Создание суперкомпьютеров похоже на гонку вооружений. Самым быстрым суперкомпьютером считается китайский Sunway TaihuLight — его производительность 93 петафлопса.
За ним идёт Tianhe-2 — суперкомпьютер из Китая производительностью 34 петафлопса. На третьем месте Piz Daint из Швейцарии и его 6,3 петафлопса. За ними идут американские Titan (17,6 петафлопсов), Sequoia (17,1) и Cori (14). Замыкает топ-7 японский Oakforest-PACS, производительностью 13,5 петафлопсов.
Россия в этом рейтинге занимает 59 место. Страну представляет «Ломоносов-2», производительностью 2,1 петафлопса.
Суперкомпьютеры используют для разных целей. С помощью самого мощного из них учёные построили виртуальную модель Вселенной. Tianhe-2 защищает сверхсекретные данные КНР и само государство. Одна из сфер применения Piz Daint — моделирование в области физики высоких энергий.
Национальная администрация ядерной безопасности США использует Sequoia для моделирования ядерных взрывов, а другие учёные — для космологического моделирования и моделирования сердца человека.
С помощью Titan проводят научные исследования: создают модели поведения нейтронов в ядерном реакторе и прогнозируют изменения климата. Oakforest-PACS используют в Японии для исследований и обучения студентов, которые интересуются суперкомпьютерами.
Эра эксафлопсов
В 2018 году в США запустят Summit — суперкомпьютер производительностью 200 петафлопсов. На это ученые Китая ответят Tianhe-3 — его производительность будет равняться одному эксафлопсу. Прототип этого суперкомпьютера появится в 2018 году. В 2020 году к гонке присоединится Франция: компания Atos планирует запустить эксафлопсный проект Bull Sequana.
Однако эксперты отмечают, что массовый переход на эксафлопсы приведет к слишком большому энергопотреблению и избыткам тепла. Чтобы оперировать эксафлопсами, мировому сообществу придется согласовать изменения во всей экосистеме компьютеров: в оборудовании, программном обеспечении, алгоритмах и приложениях.
Многие уже переходят на солнечную энергию и продвинутые системы охлаждения. Но для массового распространения мощных суперкомпьютеров этого будет недостаточно.
По словам Хорста Саймона (Horst Simon) из Национальной лаборатории им. Лоуренса в Беркли, сложность состоит в том, что мы должны сделать ряд научных прорывов одновременно. Сначала нужно понять, как сократить потребление энергии и не расходовать избытки тепла впустую. Только после этого мы сможем соревноваться.
P.S. Еще несколько материалов по теме из нашего блога:
- Конвергенция и унификация — несколько задач на одном устройстве
- Иностранный движок DPI или собственная разработка
- VPLS для доступа к ЦОД