Где прогресс в оперативной памяти и зачем её разгонять?

Привет, GT! Все мы любим новое железо — приятно работать за быстрым компьютером, а не смотреть на всякие прогрессбары и прочие песочные часики. Если с процессорами и видеокартами всё более-менее понятно: вот новое поколение, получите ваши 10–20–30–50% производительности, то с оперативкой всё не так просто.

aba65fd5e5b1fdb04fc384264cc07b07.jpg

Где прогресс в модулях памяти, почему цена на гигабайт почти не падает и чем порадовать свой компьютер — в нашем железном ликбезе.

DDR4


Стандарт памяти DDR4 имеет ряд преимуществ перед DDR3: большие максимальные частоты (то есть пропускная способность), меньшее напряжение (и тепловыделение), и, само собой, удвоенная ёмкость на один модуль.

Комитет инженерной стандартизации полупроводниковой продукции при Electronic Industries Alliance (более известный как JEDEC) трудится над тем, чтобы ваша оперативная память Kingston подходила к материнской плате ASUS или Gigabyte, и по этим правилам играют все. По части электрики, физики и разъёмов всё жёстко (оно и понятно, нужно обеспечить физическую совместимость), а вот в отношении рабочих частот, объёмов модулей и задержек в работе правила допускают некоторую волатильность: хотите сделать лучше — делайте, главное, чтобы на стандартных настройках у пользователей не было проблем.

Именно так получились в своё время модули DDR3 с частотой выше, чем 1600 МГц, и DDR4 с частотами выше 3200 МГц: они превышают базовые спецификации, и могут работать как на «стандартных» параметрах, совместимых со всеми материнскими платами, так и с экстремальными профилями (X.M. P.), протестированными на заводе и зашитыми в BIOS памяти.

c824e60842a56a4fbfa37f3025ad29a7.jpg

Прогресс


Основные улучшения в этой сфере ведутся сразу в нескольких направлениях. Во-первых, производители непосредственно микросхем памяти (Hynix, Samsung, Micron и Toshiba) постоянно улучшают внутреннюю архитектуру чипов в пределах одного техпроцесса. От ревизии к ревизии внутреннюю топологию доводят до совершенства, обеспечивая равномерность нагрева и надёжность работы.

Во-вторых, память потихоньку переходит на новый техпроцесс. К сожалению, здесь нельзя проводить улучшения также быстро, как делают (делали последние лет 10) производители видеокарт или центральных процессоров: грубое уменьшение размеров рабочих частей, то есть транзисторов, потребует соответствующего снижения рабочих напряжений, которые ограничены стандартом JEDEC и встроенными в CPU контроллерами памяти.

Поэтому единственное, что остаётся — не только «поджимать» производственные нормы, но ещё и параллельно увеличивать скорость работы каждой микросхемы, что потребует соответствующего повышения напряжения. В итоге и частоты растут, и объёмы одного модуля.

Примеров такого развития много. В 2004–2005 году нормальным был выбор между 2/4 гигабайтами DDR3 1066 МГц и DDR3 1333 МГц на один модуль (обе были выполнены по 90-нм техпроцессу). Сегодня же умирающий стандарт готов предложить вам 1600, 1866, 2000 и даже 2133 МГц рабочих частот на модулях в 4, 8 и 16 ГБ, правда внутри уже 32, 30 и даже 28 нм.

К сожалению, подобный апгрейд стоит немалых денег (в первую очередь на исследования, закупку оборудования и отладку производственного процесса), так что ждать радикального уменьшения цены 1 ГБ оперативки до выхода DDR5 не придётся: ну, а там нас ждёт очередное удвоение полезных характеристик при той же цене производства.

Цена улучшений, разгон и поиски баланса


Растущий объём и скорость работы напрямую влияет на ещё один параметр оперативной памяти — задержки (они же тайминги). Работа микросхем на высоких частотах до сих пор не желает нарушать законы физики, и на различные операции (поиск информации на микросхеме, чтение, запись, обновление ячейки) требуются определённые временные интервалы. Уменьшение техпроцесса даёт свои плоды, и тайминги растут медленнее, чем рабочие частоты, но здесь необходимо соблюдать баланс между скоростью линейного чтения и скоростью отклика.

6e69bc807148c7d5b47d0911c99350f8.jpg

Например, память может работать на профилях 2133 МГц и 2400 МГц с одинаковым набором таймингов (15–15–15–29) — в таком случае разгон оправдан: при большей частоте задержки в несколько тактов только уменьшатся, и вы получите не только увеличение линейной скорости чтения, но и скорости отклика. А вот если следующий порог (2666 МГц) требует увеличения задержек на 1–2, а то и 3 единицы, стоит задуматься. Проведём простые вычисления.

Делим рабочую частоту на первый тайминг (CAS). Чем выше соотношение — тем лучше:

2133 / 15 = 142,2
2400 / 15 = 160
2666 / 16 = 166,625
2666 / 17 = 156,823


Полученное значение — знаменатель в дроби 1 секунда / Х * 1 000 000. То есть чем выше число, тем ниже будет задержка между получением информации от контроллера памяти и отправкой данных назад.

Как видно из расчётов, наибольший прирост — апгрейд с 2133 до 2400 МГц при тех же таймингах. Увеличение задержки на 1 такт, необходимое для стабильной работы на частоте 2666 МГц всё ещё даёт преимущества (но уже не такие серьёзные), а если ваша память работает на повышенной частоте только с увеличением тайминга на 2 единицы — производительность даже немного снизится относительно 2400 МГц.

Верно и обратное: если модули совершенно не хотят увеличивать частоты (то есть вы нащупали предел для конкретно вашего комплекта памяти) — можно попытаться отыграть немного «бесплатной» производительности, снизив задержки.

На самом деле факторов несколько больше, но даже эти простые расчёты помогу не напортачить с разгоном памяти: нет смысла выжимать максимальную скорость из модулей, если результаты станут хуже, чем на средних показателях.

878beb112032a92d06aca0b257482efc.jpg

Практическое применение разгона памяти


В плане софта от подобных манипуляций в первую очередь выигрывают задачи, постоянно эксплуатирующие память не в режиме потокового чтения, а дёргающие случайные данные. То есть игры, фотошоп и всякие программистские задачи.

39c8f95ea2014ea09a77b13d6d9c9747.jpg

Аппаратно же системы со встроенной в процессор графикой (и лишённые собственной видеопамяти) получают значительный прирост производительности как при снижении задержек, так и при увеличении рабочих частот: простенький контроллер и невысокая пропускная способность очень часто становится бутылочным горлышком интегрированных GPU. Так что если ваши любимые «Цистерны» еле-еле ползают на встроенной графике старенького компа — вы знаете, что можно попробовать предпринять для улучшения ситуации.

Мэйнстрим


Как не странно, больше всего от подобных улучшений выигрывают среднестатистические пользователи. Нет, безусловно, оверклокеры, профессионалы и игроки с полным кошельком получают свои 0.5% производительности, применяя экстремальные модули с запредельными частотами, но их доля на рынке мала.

Что под капотом?


Белые алюминиевые радиаторы снять достаточно просто. Шаг нулевой: заземляемся об батарею или ещё какой металлический контакт с землёй и даём стечь статике — мы же не хотим дать нелепой случайности убить модуль памяти?

Шаг первый: прогреваем модуль памяти феном или активными нагрузками на чтение-запись (во втором случае вам надо быстренько выключить ПК, обесточить его и снять оперативку, пока она ещё горячая).

428b15efb30849198cab08bff7193688.jpg

Шаг второй: находим сторону без наклейки и аккуратно подцепляем радиатор чем-нибудь в центре и по краям. Использовать печатную плату как основание для рычага можно, но с осторожностью. Внимательно выбираем точку опоры, стараемся избегать давления на на хрупкие элементы. Действовать лучше по принципу «медленно, но верно».

Шаг третий: открываем радиатор и разъединяем замки. Вот они, драгоценные чипы. Распаяны с одной стороны. Производитель — Micron, модель чипов 6XA77 D9SRJ.

6739597ed13e42fc9e95c8742548215c.jpg

8 штук по 1 Гб каждый, заводской профиль — 2400 МГц @ CL16.

89adf4d5e521c1e2931cde9fe4072aa7.jpg
Правда, дома снимать теплораспределители не стоит — сорвёте пломбу и плакала ваша пожизненная1 гарантия. Да и родные радиаторы отлично справляются с возложенными на них функциями.

Попробуем измерить эффект от разгона оперативки на примере комплекта HyperX Fury HX426C16FW2K4/32. Расшифровка названия даёт нам следующую информацию: HX4 — DDR4, 26 — заводская частота 2666 МГц, C16 — задержки CL16. Далее идёт код цвета радиаторов (в нашем случае — белый), и описание комплекта K4/32 — набор из 4 модулей суммарным объёмом 32 ГБ. То есть уже сейчас видно, что оперативка незначительно разогнана ещё при производстве: вместо штатных 2400 прошит профиль 2666 МГц с теми же таймингами.

da901046d2864e53830570a1c88683a7.jpg

Помимо эстетического удовольствия от созерцания четырёх «Белоснежек» в корпусе вашего ПК этот набор готов предложить весомых 32 гига памяти и нацелен на пользователей обычных процессоров, не особо балующихся разгоном CPU. Современные Intel«ы без буквы K на конце окончательно лишились всех возможных способов получения бесплатной производительности, и практически не получают никаких бонусов от памяти с частотой выше 2400 МГц.

2a593a31d2454754a5a6e855547ea499.jpg

В качестве тестовых стендов мы взяли два компьютера. Один на базе Intel Core i7–6800K и материнской плате ASUS X99 (он представляет платформу для энтузиастов с четырёхканальным контроллером памяти), второй с Core i5–7600 внутри (этот будет отдуваться за мэйнстримовое железо со встроенной графикой и отсутствующим разгоном). На первом проверим разгонный потенциал памяти, а на втором будем измерять реальную производительность в играх и рабочем софте.

Разгонный потенциал


Со стандартными профилями JEDEC и заводским X.M. P. память имеет следующие режимы работы:

DDR4–2666 CL15–17–17 @1.2V
DDR4–2400 CL14–16–16 @1.2V
DDR4–2133 CL12–14–14 @1.2V


Легко заметить, что настройки таймингов под 2400 МГц делают память не такой отзывчивой, как профили 2133 и 2666 МГц.

2133 / 12 = 177.75
2400 / 14 = 171.428
2666 / 15 = 177.7(3)


Попытки завести память на частоте 2900 МГц с повышением задержек до 16–17–18, 17–18–18, 17–19–19 и даже с подъёмом напряжения до 1.3 Вольта ничего не дали. Без серьёзных нагрузок компьютер работает, но фотошоп, архиватор или бенчмарк плюются ошибками или сваливают систему в BSOD. Похоже, что частотный потенциал модулей выбран до конца, и единственное, что нам остаётся — уменьшать задержки.

f4e30f564dde50e3b8921c9f398d42d3.jpg

Лучший результат, который удалось достичь с тестовым комплектом из 4 модулей — 2666 МГц при таймингах CL13–14–13. Это существенно увеличит скорость доступа к случайным данным (2666 / 13 = 205.07) и должно показать неплохое улучшение результатов в игровом бенчмарке. В двухканальном режиме память разгоняется лучше: специалисты из oclab ухитрились довести комплект из двух 16 Гб модулей до частоты 3000 МГц @ CL14–15–15–28 с подъёмом напряжения до 1.4 Вольта — отличный результат.

7b2fa0a8df954ffc82020ca10ef927c0.png

Натурные испытания


Для нашего i5 со встроенной графикой в качестве бенчмарка мы выбрали GTA V. Игра не молодая, использует API DirectX 11, который давно известен и отлично вылизан в драйверах Intel, любит потреблять оперативную память и нагружает систему сразу по всем фронтам: GPU, CPU, Ram, чтение с диска. Классика. Вместе с этим GTA V использует т.н. «отложенный рендеринг», благодаря которому время расчёта кадра меньше зависит от сложности сцены, то есть методика испытания будет чище, а результаты — нагляднее.

За средний FPS возьмём значения, укладывающиеся в нормальное течение игры: пролёт самолёта, езда в городе, уничтожение супостатов имеют равномерный профиль нагрузки. По таким сценам (отбросив 1% лучших и худших результатов из массива данных) и получим средне-игровой FPS.

Просадки определим по сценам со взрывами и сложными эффектами (водопад под мостом, закатные пейзажи) аналогичным образом.

Подлагивания и неприятные фризы при резкой смене окружения (переключение от одного тестируемого случая к другому) случаются даже на монструозной GTX 1080Ti, постараемся их отметить, но в результаты не возьмём: в игре оно не встречается, и это, скорее, косяк самого бенчмарка.

Конфигурация демо-стенда

CPU: Intel Core i5–7500 (4c4t @ 3.8 ГГц)
GPU: Intel HD530
RAM: 32 GB HyperX Fury White (2133 МГц CL12, 2666 МГц CL15 и 2666 МГц CL13)
MB: ASUS B250M
SSD: Kingston A400 240 GB


Для начала выставим стандартные частоты X.M. P.-профиля: 2666 МГц с таймингами 15–17–17. Встроенный бенчмарк GTA V выдаёт идентичный FPS и одинаковые просадки на минимальных и средних настройках в разрешении 720p: в большинстве сцен счётчик колеблется в районе 30–32, а в тяжёлых сценах и при смене одной локации на другую FPS проседает.

c13b8631fd83483bef174f92f688331c.jpg

Причина очевидна — мощностей GPU достаточно, а вот блоки растеризации просто не успевают собрать и отрисовать большее число кадров в секунду. На «высоких» настройках графики результаты стремительно ухудшаются: игра начинает упираться непосредственно в скромные вычислительные возможности интегрированной графики.

2133 МГц CL12


Собственной памяти у GPU нет, и он вынужден постоянно дёргать системную. Пропускная способность DDR4 в двухканальном режиме на частоте 2133 МГц составит 64 бит (8 байт) × 2 133 000 000 МГц × 2 канала — порядка 34 Гб/с, с небольшими (до 10%) накладными потерями.

Для сравнения, пропускная способность подсистемы памяти у самой скромной дискретной карточки NVIDIA GTX 1030 — 48 Гб/с, а GTX 1050 Ti (которая легко выдаёт в GTA V 60 FPS на максимальных настройках в FullHD) — уже 112 Гб/с.

e6c3c58fa9bc9e37c131ae87c287d3b2.jpg
На заднем плане виден тот самый водопад под мостом, просаживающий FPS во внутриигровом бенчмарке.

Результаты бенчмарка просели до 28 FPS в среднем, а лаги при смене локаций и взрывах их ненапряжных просадок превратились в неприятные микрофризы.

2666 МГц CL13


Снижение таймингов значительно сократило время ожидания ответа от памяти, а стандартные результаты с данной частотой у нас уже есть: можно будет сравнить три бенчмарка и получить наглядную картину. Пропускная способность для 2666 МГц уже 21.3 Гб/с ×2 канала ~ 40 Гб/с, сравнимо с младшей NVIDIA.

8541a9b94425799aa4b498475941b921.jpg

Максимальный FPS практически не вырос (0.1 не показатель и находится на грани погрешности измерений) — здесь мы всё ещё упираемся в скромные возможности ROP«ов, а вот все просадки стали менее заметны. В сценах с водопадом из-за высокой вычислительной нагрузки результат не изменился, во всех остальных — то есть на прогрузках, взрывах и прочих радостях, замедлявших работу видеоядра вырос в среднем на 10–15%. Вместо 25–27 кадров в нагруженных событиями эпизодах — уверенные 28–29. В целом игра стала ощущаться значительно комфортнее.

TL; DR и результаты


Нельзя оценивать скорость работы оперативной памяти по одной только частоте. У DDR4 достаточно большие тактовые задержки, и при прочих равных стоит выбирать память не только удовлетворяющую потребности вашего железа по рабочей частоте и объёму, но и уделять внимание этому параметру.

d63ae06461c95bdf76b8361253e7b93e.jpg

Проведённые тесты показали, что компьютеры на базе Intel Core i-серии со встроенной графикой получают заметный прирост производительности при использовании высокоскоростной памяти с низкими задержками. Видеоядро не имеет собственных ресурсов для хранения и обработки данных и пользуется системными отлично отвечает (до определённого предела) на рост частоты и снижение таймингов, так как от скорости доступа к памяти напрямую зависит время отрисовки кадра со множеством объектов.

Самое важное! Линейка Fury выпускается в нескольких цветах: белом, красном и чёрном — можно подобрать не только быструю память, но и подходящую по стилю к остальным комплектующим, как делают специалисты из HyperPC.

9866b70276054c1d98e4073f24bbac5a.jpg

Закон Кирхгоффа и немного магии школьного образования позволяют утверждать, что память с чёрными радиаторами несколько будет холоднее в работе, чем другие варианты. Ну, а для неверующих в свяфтую Физику есть замечательный пруф на образовательном канале МИФИ.

Если с мэйнстримовыми решениями всё понятно, то в топовом сегменте, где каждый системник — маленькое произведение искусства применение памяти и накопителей HyperX из обычных продуктовых линеек — как знак качества. При создании каждого кастомного проекта приходится учитывать множество факторов: тепловые нагрузки, пожелания капризного клиента, распределение воздушных потоков, акустические вопросы (мощный компьютер и тихий мощный компьютер — задачи, отличающиеся по сложности на порядок). HyperPC постоянно совершенствуют свои технологические процессы и остаются верны надёжным комплектующим — отсюда и превосходные результаты в их уникальных сборках. Но если вы предпочитаете готовым компьютерам — самобсор, то подобный комплект или одиночные модули HyperX Fury DDR4 можно приобрести в сети Юлмарт.

На этом всё, но мы не прощаемся. Прохладному лету — горячие темы, подписывайтесь на наш блог и все интересности не пройдут мимо.


1 — Из-за особенностей российского законодательства «пожизненная» гарантия будет действовать всего 10 лет со дня приобретения. Впрочем, в масштабах компьютерного железа с текущими темпами развития технологий и 10 лет срок не малый, а там и законодательство может измениться.

© Geektimes