NVIDIA B200 получил чиплетную компоновку из двух кристаллов
И память типа HBM3E объёмом 192 Гбайт.
Ресурс CNBC по итогам выступления основателя и бессменного руководителя NVIDIA Дженсена Хуана (Jensen Huang) на открытии GTC 2024 опубликовал краткую выдержку по представленным на мероприятии новым техническим решениям этой марки. Во-первых, тот самый упоминаемый ещё представителями Dell ускоритель B200 оказался двухкристальным чипом с архитектурой Blackwell, который в совокупности насчитывает 208 млрд транзисторов и использует упаковку CoWoS-L (2.5D). Кристаллы в этой упаковке соединяются интерфейсом NV-HBI с пропускной способностью 10 Тбайт/с, с точки зрения программного обеспечения они работают как единое целое. Ранее NVIDIA выпускала монолитные чипы, но двухкристальная компоновка позволила значительно увеличить количество транзисторов на одной подложке, и об этом можно судить хотя бы по внешним размерам B200 при сравнении с H100.
Источник изображения: NVIDIA
По сторонам от кристаллов B200 расположились восемь стеков памяти типа HBM3E совокупным объёмом 192 Гбайт, они позволяют передавать по 8 Тбайт информации в секунду. На уровне печатной платы для объединения нескольких B200 в одной системе будет использоваться интерфейс NVLink пятого поколения, который способен симметрично передавать информацию со скоростью 1,8 Тбайт/с. Теоретически, при помощи специального коммутатора в одной системе можно объединить до 576 чипов B200.
С точки зрения производительности флагманским вычислительным решением нового поколения станет NVIDIA Grace Blackwell Superchip — ускоритель GB200, который на одной печатной плате сочетает пару чипов B200 и центральный процессор NVIDIA Grace с 72 ядрами на архитектуре Arm Neoverse V2. Потребляя до 2,7 кВт, такой ускоритель способен обеспечить быстродействие в операциях FP4 на уровне 40 петафлопс. По сравнению с базовым H100, такой ускоритель способен поднять быстродействие в 30 раз и улучшить энергетическую эффективность до 25 раз.
На GTC 2024 компания NVIDIA также представила специфические серверные системы HGX B100, HGX B200 и DGX B200, а также стоечную систему GB200 NVL72, объединяющую в себе 36 экземпляров GB200 с объёмом оперативной памяти до 30 Тбайт. В одном центре обработки данных решений NVIDIA позволяют объединять до 100 000 ускорителей GB200. Партнёры компании представят свои решения на базе B200 в этом году, но стоимость подобных ускорителей традиционно не раскрывается. Можно предположить, что базовый B200 будет дороже H100, который стоит от $25 000 до $40 000.