[Перевод] Почему повышение тока на AMD Ryzen не убьёт ваш процессор29.06.2020 11:17

Если кто-то хочет повысить быстродействие CPU, обычно он находит способ сделать это. Будь то пользователь, самостоятельно разгоняющий свой компьютер, или же производители материнских плат, подстраивающие настройки для улучшения быстродействия ЦП ещё перед продажей — в итоге всем хочется увеличить быстродействие, и по множеству причин. Эта ненасытная жажда максимального быстродействия означает, однако, что некоторые из этих подстроек и изменений могут вывести ЦП за пределы «спецификаций». В итоге часто можно видеть методы, выполняющие обещания по увеличению скорости работы за счёт увеличения температуры или сокращения времени жизни железа.

В этой связи стоит рассмотреть появившуюся недавно информацию о том, что производители материнских плат играют с настройками тока, подаваемого на процессоры от AMD. Увеличивая его, они увеличивают и потенциальную мощность процессора, что в итоге приводит к увеличению не только скорости работы, но и температуры. Такой подход к подстройке железа нельзя назвать новым, однако недавние события вызвали волну замешательства, вопросов о том, что происходит на самом деле, и какие последствия это может повлечь для процессоров AMD Ryzen. Чтобы прояснить эту ситуацию, мы решили сделать данный обзор.

Старомодные способы: методы расширения спектра, мультиядерные улучшения, PL2

За время работы редактором по материнским платам, а потом и по CPU, я постоянно сталкиваюсь с ухищрениями, на которые производители материнок готовы идти ради того, чтобы вырваться вперёд по быстродействию в гонке с конкурентами. Мы первыми рассказали о такой настройке, как «мультиядерное улучшение» [MultiCore Enhancement], появившейся в августе 2012 года, и выставляющей рабочую частоту всех ядер выше той, что указана в спецификациях, а иногда и откровенно разгоняющей рабочую частоту. Однако производители материнских плат занимались подстройкой разных свойств, связанных с быстродействием, и задолго до этого. Можно вспомнить метод расширения спектра с увеличением базовой частоты со 100 МГц до 104,7 МГц, благодаря которому увеличивалось быстродействие на поддерживающих его системах.

В последнее время на платформах Intel видны попытки производителей по увеличению пределов мощности с тем, чтобы материнские платы выдерживали турборежим работы как можно дольше — и только потому, что производители материнских плат перестраховываются при разработке обеспечения питания компонентов. За последние пару недель мы обнаружили примеры того, как некоторые производители материнских плат просто игнорируют новые требования Intel Thermal Velocity Boost.

Короче говоря, каждый производитель материнских плат хочет быть лучшим, и для этого часто размываются пределы того, что считается «базовыми спецификациями» процессора. Мы довольно часто писали о том, что граница между «спецификациями» и «рекомендуемыми настройками» может быть размытой. Для Intel мощность в режиме турбо, указанное в документации, является рекомендуемой настройкой, и любое значение, установленное на материнских платах, технически укладывается в спецификации. Судя по всему, Intel считает разгоном только увеличение частоты режима турбо.

Подстройка материнских плат с разъёмом AM4

Теперь мы переходим к новостям — производители материнских плат пытаются подстроить материнские платы Ryzen так, чтобы выжать из них больше быстродействия. Как подробно объяснялось на форумах HWiNFO, у платформ АМ4 обычно есть три ограничения: Package Power Tracking (PPT), обозначающее максимальную мощность, которую можно подавать на разъём; Thermal Design Current (TDC), или максимальный ток, подводимый к регуляторам напряжения в рамках тепловых ограничений; Electrical Design Current (EDC), или максимальный ток, который в принципе может подаваться на регуляторы напряжения. Некоторые из этих показателей сравниваются с метриками, получаемыми внутри процессора или снаружи, в сети подачи питания, с целью проверки превышения пороговых значений.

Чтобы подсчитать параметры программного управления питанием, с которым сравнивается РРТ, сопроцессор управления питанием получает значение тока от управляющего контроллера регулятора напряжения. Это не реальное значение силы тока, а безразмерная величина от 0 до 255, где 0 — это 0 А, а 255 — максимальное значение тока, которое может обработать модуль регулятора напряжения. Затем сопроцессор управления питанием проводит свои подсчёты (мощность в ваттах = напряжение в вольтах, умноженное на ток в амперах).

Этот безразмерный диапазон нужно калибровать для каждой материнской платы, в зависимости от её схемы и используемых компонентов –, а также дорожек, слоёв и качества в целом. Чтобы получить точное значение коэффициента масштаба, производитель материнских плат должен тщательно замерить правильные показатели, а потом написать прошивку, которая будет использовать эту таблицу в подсчётах мощности.

Это означает, что в принципе существует способ поиграться с тем, как система интерпретирует пиковую мощность процессора. Производители материнских плат могут уменьшать это безразмерное значение тока, чтобы процессор и сопроцессор управления питанием считали, что на процессор подаётся меньше мощности, и в итоге ограничитель PPT не активировался. Это позволяет процессору работать в режиме турбо, превосходящем то, что изначально планировали в AMD.

У этого есть несколько последствий. Процессор будет потреблять больше энергии, в основном в виде увеличения тока. Это приведёт к повышению теплоотдачи. Поскольку процессор работает быстрее (потребляя больше энергии, чем считает ПО), он покажет лучшие результаты в тестах на быстродействие.

Если у вашего процессора базовая TDP 105 Вт, а PPT равняется 142 Вт, то при нормальных условиях стоит ожидать, что на заводских настройках процессора будет рапортовать о потреблении 142 Вт. Однако если установить безразмерный показатель тока на 75% от реального, то реально он будет потреблять в районе 190 Вт = 142/0,75. Если остальные ограничения не затронуты, то процессор будет рапортовать о 75% от PPT, что будет запутывать пользователя.

Выход ли это за рамки спецификаций?

Если считать, что PPT, TDC и EDC являются основой спецификаций AMD для потребления мощности и тока, то да, это выходит за рамки спецификаций. Однако PPT по своей природе выходит за рамки TDP, поэтому тут мы уже попадаем в загадочный мир определений понятия «турбо».

Как мы уже обсуждали ранее касательно мира Intel, пиковое потребление энергии в режиме турбо Intel сообщает производителям материнских плат только в качестве «рекомендованного значения». В итоге чипы от Intel примут любое значение в качестве пикового энергопотребления, как разумные величины типа 200 Вт или 500 Вт, так и безумные, типа 4000 Вт. Чаще всего (и в зависимости от процессора), чип упирается в другие ограничения. Но в случае с самыми мощными моделями этот параметр стоит отслеживать. Значение тау, обозначающее длительность нахождения в режиме турбо, и определяющее объём ведра с энергией, из которого режим турбо её черпает, тоже можно увеличить. Вместо значения по умолчанию из диапазона от 8 до 56 секунд, тау можно увеличивать практически до бесконечности. Согласно Intel, всё это укладывается в спецификации — если производители материнских плат могут делать материнские платы, обеспечивающие все эти показатели.

Intel считает, что настройки выходят за рамки спецификаций, когда частота работы процессора выходит за пределы таблиц турбо режима для Turbo Boost 2.0 (или TBM 3.0, или Thermal Velocity Boost). Когда процессор выходит за эти пределы, Intel считает это разгоном, и считает себя свободной от выполнения гарантийных обязательств.

Проблема в том, что если попытаться перенести те же правила на ситуацию с AMD, то у AMD нет турбо-таблиц как таковых. Процессоры AMD работают, предлагая наибольшую возможную частоту в зависимости от ограничений по току и мощности в любой момент времени. При увеличении количества задействованных в работе ядер уменьшается энергопотребление каждого отдельного ядра, и вслед за ним и общая частота. И тут мы углубляемся в детали по отслеживанию огибающей частоты, и всё усложняется из-за того, что AMD может менять частоту шагами по 25 МГц в отличие от Intel, использующей шаги по 100 МГц.

Также AMD использует возможности, выводящие частоту работы чипа за пределы турбо-частоты, описанные в спецификации. Если вы считаете, что это разгон, и судите только по цифрам на коробке — тогда, да, это разгон. AMD в данном случае специально запутывает ситуацию, однако плюсом можно считать некоторое повышение быстродействия.

Подвергается ли мой процессор опасности?

Сразу ответим на этот вопрос — нет, не подвергается. У обычных пользователей с достаточным уровнем охлаждения и на стоковых настройках в течение ожидаемого срока службы проекта никаких проблем быть не должно.

У большинства современных процессов х86 есть либо трёхгодовая гарантия для ритейл-версий в коробочках, либо годовая на ОЕМ. И хотя AMD и Intel не будут менять вам процессор по окончанию этого периода, ожидается, что большая часть процессоров будет работать не менее 15 лет. Мы до сих пор тестируем разные старые процессоры в старых материнских платах, несмотря на то, что их уже давно не обслуживают (и чаще всего проблема заключается во вздувшихся конденсаторах на материнской плате, а не в процессоре).

Когда с конвейера сходит подложка с процессора, компания получает отчёт о надёжности, что помогает определить потенциальное применение для этих процессоров. Сюда входят и такие показатели, как реагирование на изменение напряжения и частоты, а также подверженность электромиграции.

Кроме физического повреждения или перегрева при отключении предела нагрева, главным способом повредиться у современного процессора будет электромиграция. В этом процессе электроны пробираются через проводники процессора и сталкиваются с атомами кремния (и других элементов), в результате выбивая их из кристаллической решётки. Само по себе это редкое явление (вспомните, к примеру, как давно работает проводка в вашем доме), однако на мелких масштабах оно может влиять на работу процессора.

После смещения атома металла в проводнике с его места в кристаллической решётке сечение проводника в этом месте уменьшается. Это увеличивает его сопротивление, поскольку оно обратно пропорционально сечению. Если выбить достаточно атомов кремния, то проводник перестанет проводить ток, и процессор уже нельзя будет использовать. Этот процесс происходит и в транзисторах — там его называют старением транзистора, из-за чего транзистору с течением времени требуется всё большее напряжение («дрейф напряжения»).

При определённых условиях электромиграция идёт быстрее — всё зависит от температуры, использования компонента и напряжения. Один из основных способов справиться с увеличившимся сопротивлением — увеличить напряжение, что в свою очередь увеличивает температуру процессора. В итоге образуется замкнутый круг, из-за которого эффективность процессора со временем падает.

При повышении напряжения (и энергии электрона) и плотности тока (электронов на площадь сечения) шансы электромиграции возрастают. При повышении температуры ситуация может ухудшиться. Все эти факторы влияют на то, сколько электронов могут запастись энергией, достаточной для осуществления электромиграции.

Неблагоприятный процесс, не правда ли? Раньше так и было. При постепенном усовершенствовании производственного процесса и схем работы логических вентилей производители применяли контрмеры, уменьшающие уровень электромиграции. При уменьшении характерных размеров и напряжения этот эффект также становится всё менее заметным — ведь площадь сечения проводников также уменьшается.

Довольно долго большая часть потребительской электроники не страдала от электромиграции. Единственный раз, когда я лично столкнулся с электромиграцией — это когда у меня был процессор Core i7–2600K Sandy Bridge 2011 года, который я разгонял на соревнованиях до 5,1 ГГц с использованием серьёзного охлаждения. В итоге он дошёл до такого состояния, что через пару лет работы ему для нормального функционирования требовалось большее напряжение.

Но тот процессор я гонял в хвост и гриву. Современное оборудование разработано так, чтобы работать десятилетие или более. Судя по отчётам, увеличение нагрева с увеличением энергопотребление оказывается не таким уж и большим. В отчёте Стилта указано, что процессор, видя наличие доступной мощности, немного увеличивает напряжение, чтобы получить прирост в 75 МГц, что увеличивает напряжение с 1,32 до 1,38 во время прогона теста CineBench R20. Пиковое напряжение, значимое для электромиграции, увеличивается всего лишь от 1,41 до 1,42. Общая мощность растёт на 25 Вт — нельзя сказать, что на порядок.

Так что, если моя материнская плата каким-то образом подстроит это воспринимаемое значение тока, не превратится ли мой процессор в кирпич? Нет. Если только у вас не будет каких-то серьёзных ошибок при сборке (например, в системе охлаждения). Всё предполагаемое время жизни продукта, и ещё лет десять после этого, вряд ли эта подстройка будет иметь какое-то значение. Как уже упоминалось, если бы даже это влияло на электромиграцию, то производители процессора встроили механизмы для того, чтобы противодействовать ей. Единственный способ следить за развитием электромиграции — это отслеживать средние и пиковые значения напряжения годами, и смотреть, подстраивает ли процессор автоматически эти параметры для компенсации.

Стоит отметить, что безразмерный показатель силы тока конечный пользователь подстраивать не может — им управляет материнская плата через обновления в BIOS. Если вы занимаетесь разгоном, то вы влияете на электромиграцию гораздо сильнее, чем эта подстройка. Если кто-то из вас беспокоится о температурных режимах, я думаю, что это как раз те люди, которые уже отслеживают и подстраивают пределы параметров в BIOS.

Как узнать, занимается ли этим моя материнская плата

Во-первых, нужно использовать стоковую систему. Если параметры PPT/TDC/EDC изменены, то система уже подстроена по-другому, поэтому сконцентрируемся только на тех пользователях, которые работают со стоковыми системами.

Затем нужно установить последнюю версию HWiNFO и тест, загружающий систему на 100%, к примеру, CineBench R20.

В HWiNFO есть метрика под названием CPU Power Reporting Deviation [отклонение энергопотребления процессора]. Наблюдайте за этим числом, когда система находится под нагрузкой. У нормальной материнской платы число будет равно 100%, а у материнской платы с подстроенным током или регуляторами напряжения этот показатель будет меньше 100%.

Уточню, что это работает, только если:

Ваш AMD Ryzen работает на полностью заводских настройках, установленных в BIOS. Никаких настроек в ОС и изменения ограничений по энергопотреблению или току.
Когда ваш процессор загружен на 100%.

Если это не так, то значение параметра Power Reporting Deviation ничего не значит. Если же эти условия выполнены, а показатель падает ниже 100%, то ваша материнская плата изменяет работу процессора.

Какие у меня есть варианты?

Если ваша материнская плата пытается выжать из процессора больше, чем надо, однако вас устраивает температурный режим и энергопотребление компьютера, то просто наслаждайтесь дополнительным быстродействием. Даже если это всего лишь дополнительные 75 МГц.

С AMD это никак не связано, поскольку вся ответственность ложится на производителей материнских плат. Пользователи могут захотеть обратиться к производителю материнских плат и попросить прислать обновление для BIOS. Если пользователь захочет вернуть такую материнскую плату в магазин, ему нужно уточнить этот вопрос у продавца.

Хотя такое поведение вроде бы нарушает спецификации PPT, на самом деле оно не выходит за (плохо обозначенные) пределы частот. Эта ситуация похожа на то, как производители материнских плат играются с ограничениями мощности на системах от Intel. Однако, возможно, было бы приятно иметь в BIOS опцию, которая позволяла бы включать и выключать такое поведение.