Сравнение производительности процессоров Intel разных поколений

cdf2e7c5d6fb47fb950681a2ffa2988a.jpgПочти каждый год на рынок выходит новое поколение центральных процессоров Intel Xeon E5. В каждом поколении попеременно меняются сокет и технологический процесс. Ядер становится всё больше и больше, а тепловыделение понемногу снижается. Но возникает естественный вопрос: «Что даёт новая архитектура конечному пользователю?»
Для этого я решил протестировать производительность аналогичных процессоров разных поколений. Сравнивать решил модели массового сегмента: 8-ядерные процессоры 2660, 2670, 2640V2, 2650V2, 2630V3 и 2620V4. Тестирование с подобным разбросом поколений является не совсем справедливым, т.к. между V2 и V3 стоит разный чипсет, память нового поколения с большей частотой, а самое главное — нет прямых ровесников по частоте среди моделей всех 4-х поколений. Но, в любом случае, это исследование поможет понять в какой степени выросла производительность новых процессоров в реальных приложениях и синтетических тестах.
Выбранная линейка процессоров имеет много схожих параметров: одинаковое количество ядер и потоков, 20 MB SmartCache, 8 GT/s QPI (кроме 2640V2) и количество линий PCI-E равное 40.
Для оценки целесообразности тестирования всех процессоров, я обратился к результатам тестов PassMark.
Ниже привожу сводный график результатов:

9d18246a18914a81825fdcfd32db1806.jpg

Так как частота существенно отличается, сравнивать результаты не совсем корректно. Но несмотря на это, с ходу напрашиваются выводы:
1. 2660 эквивалентен по производительности 2620V4
2. 2670 превосходит по производительности 2620V4 (очевидно, что за счёт частоты)
3. 2640V2 проседает, а 2650V2 бьёт всех (также из-за частоты)

Я поделил результат на частоту и получил некое значение производительности на 1 ГГц:

82f180d7cec544a9836c2d12fc66c621.jpg

Вот тут уже результаты получились более интересные и наглядные:
1. 2660 и 2670 — неожиданный для меня разбег в рамках одного поколения, 2670 оправдывает только то, что общая производительность у него весьма высока
2. 2640V2 и 2650V2 — весьма странный низкий результат, который хуже чем у 2660
3. 2630V3 и 2620V4 — единственный логический рост (видимо как раз за счёт новой архитектуры…)

Проанализировав результат я решил отсеять часть неинтересных моделей, которые не имеют ценности для дальнейшего тестирования:
1. 2640V2 и 2650V2 — промежуточное поколение, и не очень удачное, на мой взгляд — убираю из кандидатов
2. 2630V3 — отличный результат, но стоит необоснованно дороже 2620V4, учитывая аналогичную производительность и, к тому же — это уже уходящее поколение процессоров
3. 2620V4 — адекватная цена (сравнивая с 2630V3), высокая производительность и, самое главное — это единственная модель 8-ядерного процессора последнего поколения с Hyper-threading в нашем списке, поэтому однозначно оставляем для дальнейших тестов
4. 2660 и 2670 — отличный результат в сравнении с 2620V4. На мой взгляд, именно сравнение первого и последнего (на данный момент) поколения в линейке Intel Xeon E5 представляет особый интерес. К тому же у нас на складе остались достаточные запасы процессоров первого поколения, поэтому для нас это сравнение весьма актуально.

Стоимость серверов на базе процессоров 2660 и 2620V4 может отличаться почти до 2 крат не в пользу последних, поэтому сравнив их производительность и выбрав сервер на процессорах V1 — можно существенно сократить бюджет на покупку нового сервера. Но об этом предложении я расскажу после результатов тестирования.

Для тестирования было собрано 3 стенда:
1. 2 x Xeon E5–2660, 8×8Gb DDR3 ECC REG 1333, SSD Intel Enterprise 150Gb
2. 2 x Xeon E5–2670, 8×8Gb DDR3 ECC REG 1333, SSD Intel Enterprise 150Gb
3. 2 x Xeon E5–2620V4, 8×8Gb DDR4 ECC REG 2133, SSD Intel Enterprise 150Gb

PassMark PerformanceTest 9.0


При отборе процессоров на тесты я уже пользовался результатами синтетических тестов, но сейчас интересно сравнить эти модели более детально. Сравнение сделал группами: 1-ое поколение против 4-го.

3476c102f7e343779087c55987e7d324.jpg

Более подробный отчёт о тестировании позволяет сделать некоторые выводы:
1. Математика, в т.ч. и с плавающей точкой, в основном зависит от частоты. Разница в 100 МГц позволила 2660 опередить 2620V4 в расчётных операциях, в шифровании и компрессии (и это не смотря на существенную разницу в частоте памяти)
2. Физика и вычисления с использованием расширенных инструкций на новой архитектуре выполняются лучше, не смотря на низкую частоту
3. Ну и, разумеется, тест с использованием памяти прошёл в пользу процессоров V4, так как в данном случае соревновались уже разные поколения памяти — DDR4 и DDR3.

Это была синтетика. Посмотрим что покажут специализированные бенчмарки и реальные приложения.

Архиватор 7ZIP


ae6e34b9ba504d85b8085227da4a35cc.jpg

Тут результаты перекликаются с предыдущим тестом — прямая привязка к частоте процессора. При этом не важно, что установлена более медленная память — процессоры V1 уверенно берут первенство частотой.

CINEBENCH R15


CINEBENCH — это бенчмарк для оценки рабочих характеристик компьютера для работы с профессиональной программой для создания анимации MAXON Cinema 4D.

1c68bba6d43943ef8d41469bae543080.jpg

Xeon E5–2670 вытянул по частоте и побил 2620V4. А вот E5–2660, имеющий не столь видимое преимущество по частоте, проиграл процессору 4-го поколения. Отсюда вывод — этот софт использует полезные дополнения новой архитектуры (хотя возможно всё дело в памяти…), но не на столько, чтобы это было решающим фактором.

3DS MAX + V-Ray


Для оценки производительности процессоров при рендеринге в реальном приложении я взял связку: 3ds Max 2016 + V-ray 3.4 + реальная сцена с несколькими источниками света, зеркальными и прозрачными материалами, и картой окружения.

9fdd7e58d20e4dda93edaee9e249298f.jpg

Результаты получились схожи с CINEBENCH: Xeon E5–2670 показал самое низкое время рендеринга, а 2660 не смог обойти 2620V4.

1С: SQL/File


В заключение тестирования прилагаю результаты тестов gilev для 1С.

28a8f1c3f6e24ef5b3fa55e65b26df35.jpg

При тестировании базы с файловым доступом уверенно лидирует процессор E5–2620V4. В таблице приведены средние значения 20 прогонов одного и того же теста. Разница между результатами каждого стенда в случае с файловой базой была не больше 2%.
Однопоточный тест базы SQL показал весьма странные результаты. Разница получилась незначительной, учитывая разную частоту у 2660 и 2670, и разную частоту у DDR3 и DDR4. Была попытка оптимизировать настройки SQL, но результаты оказались хуже, чем было, поэтому я решил тестировать все стенды на базовых настройках.

87c68391ed114ff38f55d51055bee940.jpg

Результаты многопоточного теста SQL оказались ещё куда более странными и противоречивыми. Максимальная скорость 1 потока в МБ/с была эквивалентна индексу производительности в предыдущем однопоточном тесте.
Следующим параметром была максимальная скорость (всех потоков) — результат получился практически идентичным у всех стендов. Так как результаты разных прогонов сильно колебались (±5%) — иногда они были у разных стендов с существенным отрывом как в одну так и в другую сторону. Одинаковые средние результаты многопоточного теста SQL наводят меня на 3 мысли:
1. Такая ситуация вызвана неоптимизированной конфигурацией SQL
2. SSD стал узким местом системы и не позволил процессорам разогнаться
3. Разницы между частотой памяти и процессоров под эти задачи почти нет (что крайне маловероятно)
Если у Вас есть достоверные объяснения подобных результатов — прошу Вас поделиться ими в комментариях.
Также оказался необъяснимым результат по параметру «Рекомендуемое кол-во пользователей». Средний результат у 2660 оказался выше всех — и это при низких результатах всех тестов.
По этому вопросу также буду рад увидеть Ваши комментарии.

Выводы


Результаты нескольких разносторонних вычислительных тестов показали, что частота процессора в большинстве случаев оказалась важней поколения, архитектуры и даже частоты памяти. Безусловно есть современный софт, который использует все улучшения новой архитектуры. Например, транскодирование видео иногда производится в т.ч. с использованием инструкций AVX2.0, но это специализированное ПО —, а большинство серверных приложений по прежнему привязаны к количеству и частоте ядер.
Разумеется я не заявляю, что разницы между процессорами нет совсем никакой, я лишь хочу отметить, что для определённых приложений нет смысла в «плановом» переходе на новое поколение.
Если Вы со мной не согласны или у Вас есть предложения для тестирования — стенды пока не разобраны, и я буду рад произвести тестирование Ваших задач.

Экономическая выгода


Как я уже писал в начале статьи — мы предлагаем линейку серверов на базе процессоров Xeon E5 первого поколения, которые по стоимости существенно бюджетней серверов на E5–2620V4.
Это такие же новые серверы (не путать с б/у) с гарантией 3 года.
Ниже привожу ориентировочный расчет:

Сервер STSS Flagman RX227.4–008LH в конфигурации 2 х Intel Xeon E5–2620V4 + 8×8Gb DDR4 ECC REG в розницу стоит на сегодняшний день 265065р.

Аналогичная конфигурация STSS Flagman EX227.3–008LH на базе 2 х Intel Xeon E5–2660 + 8×8Gb DDR3 ECC REG по акции доступна за 175275р.

Читатели Хабра могут получить при заказе дополнительную скидку 5%. Для этого необходимо выбрать нужный форм-фактор корпуса из списка моделей на нашем сайте. Модель EX217.3–004LH выполнена в 1U-корпусе, EX227.3–008LH — 2U, а EX240.3–008LH построена на базе корпуса Tower/4U.
В конфигураторе модели можно подобрать необходимые параметры памяти, дисковой подсистемы и дополнительных устройств. При отправке заявки на расчет необходимо указать промокод HABRAHABR.

Спасибо за внимание! Буду ждать Ваших комментариев и пожеланий по тестам.

Написание статьи и тестирование: Usikoff
Тестирование 1C: sarge74

Комментарии (0)

© Habrahabr.ru