AMD Radeon Instinct MI60 готова подвинуть NVIDIA Volta из удалённых сервисов и ML08.11.2018 10:20

Борьба за обслуживание удалённых ресурсов и систем с элементами машинного обучения выходит на новый уровень. Для решения этих задач компания AMD на днях представила 7-нм GPU Vega 20 и адаптеры AMD Radeon Instinct MI60 и MI50 на их основе. Напомним, графические процессоры AMD нового поколения содержат 13,2 млрд транзисторов и только за счёт перехода от 14 нм на 7 нм обещают прирост производительности на 25%. Старшая версия GPU Vega 20 в составе адаптера Radeon Instinct MI60 содержит 64 вычислительных блока (4096 потоковых процессоров) и 32 Гбайт бортовой памяти HBM2. Шина адаптера — PCI Express 4.0.

Отличительной особенностью новых GPU AMD от NVIDIA Volta стало использование AMD 32-битных накопительных регистров «смешанной точности», тогда как NVIDIA использует классические блоки для операций умножения-сложения (multiply-accumulate). Смешанный подход AMD позволил компании создать поистине универсальное решение для области машинного обучения, где половинная точность (FP16) играет главную, но не последнюю роль. Тем самым процессор AMD GPU Vega 20 поддерживает 4- и 8-битные целочисленные вычисления и 16-, 32- и 64-битные вычисления с плавающей запятой. Как видно ниже из представленного AMD графика, AMD GPU Vega 20 на одной из моделей обучения обходит NVIDIA Volta на 7% в режиме расчётов с одинарной точностью (FP32), а в другой модели оказывается быстрее на 1% в режиме расчётов с двойной точностью (FP64).

Важно отметить, что при небольшой разнице в производительности площади кристаллов AMD GPU Vega 20 и NVIDIA Volta отличаются более чем в два раза: площадь 7-нм решения AMD равна 331 мм², а 12-нм решения NVIDIA — 800 мм². Как видим, размер кристалла для производительности не имеет значения, тогда как предложение AMD окажется дешевле с точки зрения себестоимости и, очевидно, с позиции стоимости в продаже.

В режиме тренировки для машинного обучения адаптер AMD Radeon Instinct MI60 обеспечит до 29,5 терафлопс (для точности FP16). В режиме принятия решений производительность обещает оказаться на уровне до 59 TOPS для целочисленных 8-битных расчётов и 118 TOPS для 4-битных. Кроме этого новинка AMD обещает развитую аппаратную виртуализацию. Например, один графический процессор поддерживает до 16 виртуальных машин или может «растянуть» одну виртуальную машину на 8 адаптеров (GPU). И всё это «даром» — без лицензии на какое-либо ПО. Очевидно, данная поддержка будет прописана в драйверах.

Осталось дождаться релизных версий пакетов AMD. Без этого поставки адаптеров Radeon Instinct особенного смысла иметь не будут. Сама компания обещает начать поставки старших решений в виде AMD Radeon Instinct MI60 до конца текущего года, а чуть менее производительных AMD Radeon Instinct MI50 (они окажутся медленнее флагманов примерно на 10%) — в первом квартале нового года.