Intel представила чудовищный GPU с 16 384 ядрами и производительностью свыше 40 TFLOPS
Компания Intel сегодня провела мероприятие Architecture Day 2020, на котором рассказала немало нового. И, наверное, одним из самых впечатляющих анонсов был анонс линейки графических ускорителей XE HP.
Стоит сразу оговорить, что нацелены они не на потребительский сегмент, а на центры обработки данных, то есть сравнивать карты XE HP нужно, к примеру, с Nvidia A100 или грядущей картой AMD Radeon Instinct Mi100.
Чем же примечателен продукт Intel? Как минимум своими параметрами и производительностью. Ускорители линейки XE HP будут существовать в трёх модификациях: с одним чипом, двумя и четырьмя. Сама Intel называет чипы плитками (tiles). То есть GPU XE HP, кроме базового, будут многочиповыми, как современные настольные и серверные процессоры AMD.
Каждый чип будет содержать 512 исполнительных блоков с 4096 «ядрами» в каждом. Соответственно, топовое решение линейки сможет похвастаться 16 384 ядрами!
Занятно, что эта информация всплыла в Сети ещё в начале года, и теперь оказалось, что всё это было правдой. В итоге производительность топового ускорителя с четырьмя чипами, работающего на частоте 1,3 ГГц, составит невероятные 42 TFLOPS (FP32)! Для сравнения, у той же Nvidia A100 с её монструозным GPU, содержащим 54 млрд транзисторов, производительность «всего» 19,5 TFLOPS.
Правда, преимущество решения Intel объясняется крайне просто. Дело в том, что эта самая производительность в TFLOPS высчитывается по очень простой формуле: тактовая частота в МГц умножается на количество ядер в чипе и умножается на количество обрабатываемых инструкций за такт, а потом всё это умножается на 106. То есть при подсчёте такой производительности не учитываются многочисленные особенности архитектуры и так далее, но и нужны эти сухие цифры далеко не всегда. Как бы там ни было, топовый ускоритель XE HP очень впечатляет, и ещё более интересно то, что создала его Intel.
Intel во время презентации показала, на что способен её продукт. XE HP всего с одним чипом без труда справился с перекодированием 10 потоков видео HEVC 4K со скоростью 60 к/с в режиме реального времени. При этом Intel говорит практически об идеальной масштабируемости, то есть топовый вариант XE HP сможет справляться уже с 40 потоками!
© iXBT