Замеряем зависимость производительности процессора AMD EPYC 7551 от установленной памяти

У нас в HOSTKEY был освобожденный клиентом сервер с платой SuperMicro и процессором AMD EPYC 7551, коробка регистровой памяти DDR4 разной скорости и пара часов свободного времени. Ничто не мешало посмотреть, как зависит производительность машины от количества установленных планок.

Тестовый стенд

Двухпроцессорная материнская плата SuperMicro H11DSi имеет 16 слотов памяти и стоит 63400 рублей в «Регарде» или от €700 в Нидерландах (по июньским прайсам 2022 года).  Есть несколько ее модификаций: Rev 1 поддерживает память до 2666 МГц, а Rev 2 — до 3200 МГц (это важно). В плату можно установить стик М2 NVMe безо всяких переходников или 6 таких стиков с переходниками.

1d1630a07948431c62616ada922d1e26.jpeg

Разумный максимум памяти для SuperMicro H11DSi составляет 16×64=1024 ГБ, а модули 16/3200 в Европе стоят около €100 (в Москве, по данным regard.ru, их цена составляет примерно 15000 рублей).  Модули на 32 и 64 ГБ стоят пропорционально дороже: €200 (30000 рублей) и €400 (65000 рублей). Более медленная память на 2133 МГц стоит в два раза дешевле: примерно €50 евро на eBay и Авито.

Процессор у нас старый, еще первого поколения (32 ядра на 64 потока,   2.0 ГГц базовой частоты с турбо до 3 ГГц).  Такие стоят €250 на eBay из Китая и €350 в Европе с доставкой за пару дней уже с VAT.  TDP процессора составляет 180 Вт, что еще позволяет эксплуатировать его в ЦОД с одноюнитовыми корпусами и блоками питания на 500 — 600 Вт. Если TDP будет чуть выше, придется ставить корпус на 2U и активные радиаторы.

Приступаем к проверке

Давайте посмотрим, что получится, если в нашу плату установить 1, 2, 4 или 8 модулей памяти. Что будет, если установить второй процессор? Память для тестов мы взяли старую: одноранговые планки на 8 ГБ (2133 МГц) и чуть более новые двухранговые на 16 ГБ (2666 МГц). Модули на 3200 МГц наш процессор не тянет, поэтому использовать их придется с максимальной для EPYC 7551 частотой в 2666 МГц.

e678f42f51edd2b1684aab403118459d.jpeg95cc7e8a8fd143c118303aad7dc779e4.jpeg

Тестировать будем на скорую руку с помощью Passmark и Linpak Extreme в режиме замера производительности, что довольно точно отражает производительность системы и ее стабильность.

Тест №1: 1 процессор, 8 модулей

8f22e0a10b23772d987de25730fa9ab3.pngdfced7d3f7dae5c6ba7538aae11ea0c3.pngbd3e38e4ed9194f567b2701e07c6cb26.png

Система показывает 181 Гфлопс на коротком тесте и около 19000 единиц Passmark: примерно на уровне современных  i9–10900 и несколько больше чем у i9–9900K с 8 ядрами и 4 ГГц частоты. Неплохо для процессора 2017 года, который можно купить за €250.

Тест №2: 1 процессор, 4 модуля на 2133 МГц

af5c630bc99050f070a2e55ad8f3ac41.pngcf9700bae215f338209f2d07574113fa.png2187ca50a044c7460ff1fac7a8632f1a.png

Видно, что результаты странные: нам пришлось их перепроверить, но цифры во всех итерациях были одинаковыми. Linpak Extreme падение производительности процессора на 5% и производительности памяти на 10%, а синтетика Passmark дала 27500 — где-то на уровне Xeon Gold с 22 ядрами.  

Тест №3: 1 процессор, 4 модуля на 2666 МГц

04fd2ab0194b1df7d0c884a58d7aadae.png2792540d620c64dbd202c68e3569f71e.pnga92d0084cc303f4ea0921286d46b69a0.png

Немного увеличив частоту памяти, мы получили 200 Гфлопс и 29809 единиц в Passmark. Память работает на 10% быстрее, тест быстрее на 25%. Неплохо.

Тест №4: 1 процессор, 2 модуля на 2133 МГц

c55caaa9d4197d2ce6c58b869c4c6f8f.pngb523f7484e4798c345a12743df6db347.png9bfd7060ba4a10bed8615f10f22a0da3.png

Процессор показывает результаты чуть хуже чем с 4 модулями, но производительность памяти сильно деградировала (на 30%). 

Тест №5: 1 процессор, 1 модуль на 2133 МГц

9596131c8c00102c293d0ecf8d53f371.png1369ac6c1008f91a1328f10df0ad5bef.png7a229ae7113e2e7034437b8bdd157dee.png

Я было подумал, не зависла ли машина под Linpak Extreme, но нет, просто она она еле шевелилась. Это явно аварийный режим работы — не надо так делать.

Тест №6: 2 процессора, 8 модулей памяти (по 4 на процессор)

3a4cbe6478156ae132d82a93393a75d8.pnge80b9fc7145b2623de87f0f1e10b0e11.png538e752b2927b8b9883a271ebda48799.png

Два процессора работают быстрее чем один, но не кратно: 260 Гфлопс и 50000 в Passmark — это отлично за €700 Евро. Для достижения подобного результата на Intel потребуются два новеньких Xeon Gold 6242R по €3000 за каждый.  

Тест №7: 2 процессора, 4 модуля памяти (по 2 на процессор)

259a0275dbc35e34d382e3362e9206a4.png109ac5f634e449944922c1cbb34c20ee.pngcdf97d3fea4bc81a6131df16bea800e4.png

Системе поплохело: мы сходу получили падение производительности на 15 — 20%. Не надо так.

Тест №8: 2 процессора, 2 модуля памяти (по 1 на процессор)

3b42d7c2603896232a9a95c459ff055d.pngfcc01b93ec5055f7c88243a76072b092.pnge09ca74f59d62213a6080f14bb44c30a.png

Не надо так, грустно смотреть.

Финальный тест: 2 процессора и полностью забитые модули

144c5e5a3722f9bde954bdea1874e1fd.png9e7644a98da1a5523d552c669e2fce00.png

Система с шестнадцатью модулями памяти обеспечивает максимальную производительность: синтетические тесты в Passmark дают результат на 10% выше чем с восемью модулями, а Linpak Extreme показывает прирост на 40% — 370 Гфлопс против 260 Гфлопс. Ровно в два раза быстрее чем 1 процессор показал с 8 модулями памяти.   

Итоги

Результаты получились немного неожиданными. Выяснилось, что меньше 4 модулей памяти на процессор в плату устанавливать не стоит, а 1 модуль ставить нельзя, даже если очень хочется. Разница в скорости памяти серьезно сказывается на производительности EPYC — не экономьте. Если не хотите сильно пожалеть, ставьте самые быстрые модули из тех, которые можно купить. Внимательно следите, чтобы материнская плата поддерживала высокие частоты (старые модели могут не потянуть 3000 МГц и выше).

Использование подобной техники позволяет HOSTKEY предлагать клиентам высокопроизводительные выделенные серверы на базе AMD EPYC примерно за €240 в месяц (с оплатой в рублях с НДС российской компании или в евро — компании в Нидерландах). Если хотите разместить заказ, обратитесь к консультанту на сайте и скажите »Я С ХАБРА» — получите дополнительную скидку.

Мы обязательно проведем тесты еще раз и сравним результаты для машин из свежего ассортимента с AMD EPYC и старших Ryzen 9 5950 (16 ядер на 4 ГГц), а также с Intel Xeon Gold.  

© Habrahabr.ru