Процессорные войны. История синего зайца и красной черепахи

Современная история противостояния Intel и AMD на процессорном рынке ведёт свой отсчет еще со второй половины 90-х. Эпоха грандиозных преобразований и выхода в мэйнстрим, когда Intel Pentium позиционировался как универсальное решение, а Intel Inside стал чуть ли не самым узнаваемым слоганом в мире, ознаменовалась яркими страницами в истории не только синих, но и красных — начиная с поколения K6, AMD неустанно соперничали с Intel во многих сегментах рынка. Однако именно события чуть более позднего этапа — первой половины нулевых — и сыграли важнейшую роль в появлении легендарной архитектуры Core, до сих пор лежащей в основе процессорной линейки Intel.

Немного истории, истоков и революции


Начало 2000-х годов во многом связывают с несколькими этапами в развитии процессоров — это и гонка за заветной частотой 1 ГГц, и появление первого двухъядерного процессора, и ожесточение борьбы за первенство в массовом десктопном сегменте. После безнадежного устаревания Pentium, и выхода на рынок Athlon 64×2 Intel представила процессоры поколения Core, ставшие в итоге поворотной точкой в развитии индустрии.

image

Первые процессоры Core 2 Duo были анонсированы в конце июля 2006 года — более чем через год после выхода Athlon 64×2. В работе над новым поколением Intel руководствовалась в первую очередь вопросами архитектурной оптимизации, добившись высочайших показателей энергоэффективности уже в первых поколениях моделей на базе архитектуры Core под кодовым названием Conroe — они превосходили Pentium 4 в полтора раза, и при заявленном теплопакете в 65 Вт стали, пожалуй, самыми энергоэффективными процессорами на рынке на тот момент. Выступая в роли догоняющей (что бывало нечасто), Intel реализовала в новом поколении поддержку 64-битных операций с архитектурой EM64T, новый набор инструкций SSSE3, а также обширный пакет технологий виртуализации на базе х86.

image
Кристалл микропроцессора Core 2 Duo

Помимо этого, одной из ключевых особенностей процессоров Conroe являлся объемный L2-кэш, влияние которого на общую производительность процессоров было весьма ощутимо уже тогда. Приняв решение разграничить сегменты процессоров, Intel отключила половину из 4 Мб L2-кэша для младших представителей линейки (Е6300 и Е6400), обозначив тем самым начальный сегмент. Тем не менее, технологические особенности Core (низкое тепловыделение и высокая энергоэффективность, связанные с использованием свинцового припоя) позволяли продвинутым пользователям добиваться невероятно высоких частот на передовых решениях системной логики — качественные материнские платы позволяли разгонять FSB-шину, увеличивая частоту младшего процессора вплоть до 3 ГГц и более (обеспечивая в сумме 60% прирост), благодаря чему удачные экземпляры Е6400 могли побороться со старшими браться Е6600 и Е6700, пусть и ценой значительных температурных рисков. Впрочем, даже скромный разгон позволял достичь серьезных результатов — в бенчмарках старшие процессоры без труда потеснили передовые Athlon 64×2, обозначив позицию новых лидеров и народных любимцев.

Помимо этого, Intel запустила в производство настоящую революцию — четырехъядерные процессоры семейства Kentsfield с префиксом Q, построенные на тех же 65 нанометрах, но использующие структуру из двух чипов Core 2 Duo на одной подложке. Добившись максимально возможной энергоэффективности (платформа потребляла столько же, сколько и два используемых кристалла по отдельности), Intel впервые показала, насколько мощной может быть система с четырьмя потоками — в мультимедийных приложениях, архивации и тяжелых играх, активно использующих распараллеливание нагрузки на несколько потоков (в 2007 году таковыми были нашумевший Crysis и не менее знаковая Gears of War) разница в производительности с однопроцессорной конфигурацией могла составлять до 100%, что являлось невероятным преимуществом для любого покупателя системы на базе Core 2 Quad.

image
Склейка двух C2D на одной подложке — Core 2 Quad

Как и в случае с линейкой Pentium, наиболее быстрые процессоры получили приставку Extreme с префиксом QX, и были доступны для энтузиастов и сборщиков OEM-систем по значительно более высокой цене. Венцом 65-нм поколения стал QX6850 с частотой в 3 ГГц и быстрой FSB-шиной, работающей на частоте в 1333 МГц. Этот процессор вышел в продажу по цене в 999 долларов.

Конечно же, такой оглушительный успех не мог не встретить конкуренции со стороны AMD, но красный гигант на то время еще не перешел к производству четырехъядерных процессоров, поэтому для противостояния новинкам от Intel была представлена экспериментальная платформа Quad FX, разработанная в сотрудничестве с NVidia, и получившая лишь одну серийную модель материнской платы ASUS L1N64, рассчитанную на использование двух процессоров Athlon FX X2 и Opteron.

image
ASUS L1N64

Платформа оказалась любопытной технической инновацией в мейнстриме, однако масса технических условностей, огромное энергопотребление и посредственная производительность (в сравнении с моделью QX6700) не позволили платформе успешно побороться за верхний сегмент рынка — Intel одержала верх, а процессоры Phenom FX, располагающие четырьмя ядрами, появились у красных лишь в ноябре 2007 года, когда конкурент уже был готов сделать следующий шаг.

Линейка Penryn, которая по своей сути являлось так называемым die-shrink (уменьшением размеров кристалла) 65-нм чипов из 2007 года, дебютировала на рынке уже 20 января 2008 года с процессоров Wolfdale — всего через 2 месяца после выхода Phenom FX от AMD. Переход на 45-нм техпроцесс с использованием новейших диэлектриков и материалов производства позволил расширить горизонты архитектуры Core еще дальше. Процессоры получили поддержку SSE4.1, поддержку новых особенностей энергосбережения (вроде Deep Power Down, едва ли не обнуляющую энергопотребление в состоянии гибернации на мобильных версиях процессоров), а также стали значительно холоднее — в некоторых тестах разница могла достигать 10 градусов по сравнению с прежней серией Conroe. Прибавив в частоте и производительности, а также получив дополнительный L2-кэш (для Core 2 Duo его объем вырос до 6 Мб), новые процессоры Core закрепили лидирующие позиции в бенчмарках, и подготовили почву для дальнейшего витка ожесточенной конкуренции, и начала новой эпохи. Эпохи невиданного успеха, эпохи стагнации и затишья. Эпохи процессоров Core i.

Шаг вперед и ноль назад. Первое поколение Core i7


Уже в ноябре 2008 года Intel представила новую архитектуру Nehalem, ознаменовавшую выход первых процессоров из серии Core i, прекрасно знакомую каждому пользователю сегодня. В отличие от хорошо знакомой Core 2 Duo, архитектура Nehalem изначально предусматривала нахождение четырех физических ядер на одном кристалле, а также ряд архитектурных особенностей, известных нам по техническим новинкам от AMD — это и интегрированный контроллер памяти, и разделяемый кэш третьего уровня, и QPI-интерфейс, заменяющий HyperTransport.

image
Кристалл микропроцессора Intel Core i7–970

С переносом контроллера памяти под крышку процессора Intel была вынуждена перестроить всю структуру кэша, сократив объем кэш-памяти L2 в пользу объединенного L3, объемом в 8 Мб. Впрочем, такой шаг позволил значительно сократить число запросов, а сокращение кэша L2 до 256 Кб на ядро оказалось эффективным решением с точки зрения скорости работы с многопоточными вычислениями, где основная часть нагрузки адресовалась на общий L3-кэш.
Помимо реструктуризации кэша, в Nehalem Intel сделала шаг вперед, обеспечив процессорам поддержку DDR3 на частотах 800 и 1066 МГц (впрочем, первые стандарты были далеко не предельными для этих процессоров), и избавившись от поддержки DDR2 в отличие от AMD, использовавшую принцип обратной совместимости в процессорах Phenom II, доступных как на AM2+, так и на новых AM3-сокетах. Сам контроллер памяти в Nehalem мог работать в одном из трех режимов с расчётом на один, два или же три канала памяти на 64, 128 или 192-битной шине соответственно, благодаря чему производители материнских плат размещали на текстолите до 6 DIMM разъемов памяти DDR3. Что касается QPI-интерфейса, то он сменил уже устаревшую FSB-шину, увеличив пропускную способность платформы по меньшей мере вдвое — что было особенно удачным решением с точки зрения повышения требований к частотам памяти.

Вернулся в Nehalem и порядком подзабытый Hyper-Threading, наделив четыре мощных физических ядра восьмью виртуальными потоками, и дав начало «тому самому SMT». Фактически, HT был реализован еще в Pentium, однако с тех самых пор о нем в Intel не вспоминали до текущего момента.

image
Технология Hyper-Threading

Еще одной технической особенностью первого поколения Core i была собственная частота работы контроллеров кэша и памяти, настройка которых предусматривала изменение нужных параметров в BIOS — Intel рекомендовала удваивать значение частоты памяти для оптимальной работы, однако даже такая мелочь могла стать проблемой для части пользователей, особенно при разгоне QPI-шины (она же шина BCLK), ведь разблокированный множитель получил лишь немыслимо дорогой флагман линейки i7–965 с припиской Extreme Edition, а 940 и 920 имели фиксированную частоту с множителем 22 и 20 соответственно.

Nehalem стал больше и физически (размеры процессора по сравнению с Core 2 Duo несколько увеличились из-за переноса контроллера памяти под крышку) и виртуально.

image
Сравнение размеров процессоров

Благодаря «умному» мониторингу системы питания контроллер PCU (Power-Control Unit) вместе с Turbo-режимом позволял получить чуть больше частоты (а, следовательно, и производительности) даже без ручной настройки, ограничиваясь лишь паспортными значениями в 130 Вт. Правда, во многих случаях эту границу можно было несколько отодвинуть изменением настроек BIOS, получив дополнительные 100–200 МГц.
Итого архитектура Nehalem могла предложить многое — значительный прирост мощности в сравнении с Core 2 Duo, многопоточную производительность, мощные ядра и поддержку новейших стандартов.

С первым поколением i7 связано одно непонимание, а именно — присутствие двух сокетов LGA1366 и LGA1156 с одними и теми же (на первый взгляд) Core i7. Тем не менее, два набора логики были обусловлены не прихотью жадной корпорации, а переходом к архитектуре Lynnfield, следующему шагу в развитии линейки процессоров Core i.

Что же до конкуренции со стороны AMD, то красный гигант не спешил переходить на новую революционную архитектуру, спеша угнаться за темпами Intel. Используя старую-добрую K10, в компании выпустили Phenom II, ставший переходом на 45-нм техпроцесс первого поколения Phenom без каких-либо существенных архитектурных изменений.

image

Благодаря уменьшению площади кристалла AMD смогли использовать дополнительное пространство для размещения внушительного L3-кэша, который по своей структуре (как и общая компоновка элементов на кристалле) примерно соответствует наработкам Intel с Nehalem, но имеет ряд недостатков, обусловленных стремлением к экономии и обратной совместимости со стремительно стареющей платформой AM2.

Исправив недочеты в работе Cool«n"Quiet, практически не функционирующей в первом поколении Phenom, AMD выпустила две ревизии Phenom II, первая из которых была адресована пользователям на старых чипсетах из поколения AM2, а вторая — для обновленной платформы AM3 с поддержкой памяти DDR3. Именно желание сохранить поддержку новых процессоров на старых материнских платах и сыграло с AMD злую шутку (которая, впрочем, еще повторится в будущем) — из-за особенностей платформы в виде медленного северного моста новые Phenom II X4 не могли работать на ожидаемой частоте uncore-шины (контроллера памяти и L3-кэша), потеряв еще некоторую долю производительности в первой ревизии.
Тем не менее, Phenom II вышел доступным и достаточно производительным, чтобы показать результаты на уровне предыдущего поколения Intel –, а именно Core 2 Quad. Конечно же, это означало лишь то, что с Nehalem в AMD конкурировать были не готовы. Совсем.
А потом прибыл Westmere…

Westmere. Дешевле, чем у AMD, быстрее, чем у Nehalem


Преимущества Phenom II, представленного красным гигантом в качестве бюджетной альтернативы Q9400, крылись в двух вещах. Первая — очевидная совместимость с платформой AM2, которую приобрело множество поклонников недорогих компьютеров во времена выхода первого поколения Phenom. Вторая — вкусная цена, с которой не могли поспорить ни дорогостоящие i7 9хх, ни более доступные (но уже невыгодные) процессоры серии Code 2 Quad. AMD делала ставку на доступность для самого широкого круга пользователей, неискушенных геймеров и экономных профессионалов, но у Intel уже был план того, как побить все карты красного чипмейкера одной левой.

В его основе лежал Westmere — следующий архитектурный этап развития Nehalem (ядра Bloomfield), зарекомендовавших себя среди энтузиастов и тех, кто предпочитает брать самое лучшее. На этот раз Intel отказалась от дорогостоящих комплексных решений — новый набор логики на базе сокета LGA1156 лишился QPI-контроллера, получив архитектурно упрощенный DMI, обзавелся двухканальным контроллером памяти DDR3, а также в очередной раз переадресовал часть функций под крышку процессора — на этот раз им стал PCI-контроллер.

Несмотря на то, что визуально новые Core i7–8хх и Core i5–750 идентичны по размерам Core 2 Quad, благодаря переходу на 32 нм кристалл оказался даже больше по размеру, чем у Nehalem — принеся в жертву дополнительные выходы QPI и объединив блок стандартных I/O портов, инженеры Intel интегрировали PCI-контроллер, который занимает 25% площади кристалла и был призван сократить до минимума задержки по работе с GPU, ведь дополнительные 16 линий PCI никогда не были лишними.

В Westmere был доработан и Turbo-режим, построенный по принципу «больше ядер — меньше частоты», использованному в Intel до сих пор. По логике инженеров, ограничение в 95 Вт (а именно столько было положено потреблять обновленному флагману) достигалось в прошлом далеко не всегда из-за упора на разгон всех ядер в любой ситуации. Обновленный режим позволял применять «умный» разгон, дозируя частоты таким образом, что при использовании одного ядра остальные отключались, освобождая дополнительное питание для разгона задействованного ядра. Таким нехитрым образом и получилось, что при разгоне одного ядра пользователь достигал максимальной тактовой частоты, при разгоне двух — уже меньшей, а при разгоне всех четырех — незначительной. Так Intel обеспечила максимальное быстродействие в большинстве игр и приложений, использующих один или два потока, сохранив энергоэффективность, о которой AMD тогда могла только мечтать.

image

Существенно доработан был и Power Control Unit, отвечающий за распределение питания между ядрами и другими модулями на кристалле. Благодаря усовершенствованию техпроцесса и инженерным доработкам материалов, Intel смогла создать практически идеальную систему, в которой процессор, пребывая в idle-состоянии, способен практически не потреблять питания ВООБЩЕ. Примечательно, что достижение подобного результата не связано с архитектурными изменениями — блок PSU-контроллера перекочевал под крышку Westmere без каких-либо изменений, и лишь повышение требований к материалам и общему качеству позволили сократить до нуля (или почти до нуля) токи утечек из отключенных ядер процессора и сопутствующих им модулей в idle-состоянии.

Разменяв трехканальный контроллер памяти на двухканальный, Westmere мог потерять часть производительности, но благодаря повышенной частоте памяти (1066 у мейнстримных Nehalem, и 1333 у героя этой части статьи) новый i7 не только не потерял в производительности, но и в некоторых моментах оказался быстрее процессоров Nehalem. Даже в приложениях, которые не используют все четыре ядра, i7 870 оказался практически идентичен старшему собрату благодаря преимуществу в частоте DDR3.

Игровая производительность обновленного i7 была практически идентична лучшему решению прошлого поколения — i7 975, который обходился вдвое дороже. При этом младшее решение балансировало на грани с Phenom II X4 965 BE, иногда опережая его уверенно, а иногда — лишь немного.
Но цена была именно тем вопросом, который смущал всех поклонников Intel — и решение в виде невероятных $199 за Core i5 750 устроила всех, как нельзя лучше. Да, режима SMT здесь не было, но мощные ядра и отличная производительность позволили не только обойти флагманский процессор AMD, но и сделать это гораздо дешевле.

Для красных настали темные времена, но у них был козырь в рукаве — к выходу готовился процессор нового поколения AMD FX. Правда и Intel не пришли безоружными.

Рождение легенды и великая битва. Sandy Bridge vs AMD FX


Оглядываясь на историю взаимоотношений двух гигантов, становится очевидно, что именно период 2010–2011 года был связан с самыми невероятными ожиданиями для AMD, и неожиданно успешными решениями для Intel. Хотя обе компании рисковали, презентуя совершенно новые архитектуры, для красных анонс следующего поколения мог стать губительным, тогда как Intel, в общем-то, сомнений не испытывала.
Если Lynnfield был масштабной работой над ошибками, то Sandy Bridge вернул инженеров к чертежной доске. Переход на 32 нм ознаменовал создание монолитного базиса, уже ничуть не похожего на раздельную компоновку, использованную в Nehalem, где два блока по два ядра делили кристалл на две части, а вторичные модули располагались по сторонам. В случае с Sandy Bridge Intel создали монолитную компоновку, где ядра располагались единым блоком, используя общий L3-кэш. Был полностью переработан исполнительный конвейер, формирующий pipeline задачи, а высокоскоростная кольцевая шина обеспечивала минимальные задержки при работе с памятью и, как следовательно, высочайшую производительность в любых задачах.

image
Кристалл микропроцессора Intel Core i7–2600k

Появилась под крышкой и интегрированная графика, которая занимает по площади все те же 20% кристалла — впервые за долгие годы Intel решила серьезно заняться встроенным GPU. И хотя по меркам серьезных дискретных карт такой бонус не является чем-то значительным, то самые скромные графические карты Sandy Bridge вполне могли бы оказаться ненужными. Но несмотря на отведенные под графический чип 112 миллионов транзисторов, в Sandy Bridge инженеры Intel сделали ставку на увеличение производительности ядер без увеличения площади кристалла, что на первый взгляд не является простой задачей — кристалл третьего поколения всего на 2 мм2 больше, чем некогда был у Q9000. Удалось ли инженерам Intel совершить невероятное? Сейчас ответ кажется очевидным, но давайте сохраним интригу. Скоро мы к этому вернёмся.

Помимо совершенно новой архитектуры Sandy Bridge стал еще и самой масштабной линейкой процессоров в истории Intel. Если во времена Lynnfield синие представили 18 моделей (11 для мобильных ПК и 7 для десктопов), то теперь их ассортимент увеличился до 29 (!) SKU всех возможных профилей. Настольные ПК на релизе получили 8 из них — от i3–2100 до i7–2600k. Иными словами — были покрыты все сегменты рынка. Самый доступный i3 предлагали за $117, а флагман обходился в $317, что по меркам прежних поколений было невероятно дешево.
В маркетинговых презентациях Intel называли Sandy Bridge «вторым поколением процессоров линейки Core», хотя технически до него таких поколений было три. Свою логику синие объяснили нумерацией процессоров, в которых цифра после обозначения i* приравнивалась к поколению — именно по этой причине многие до сих пор полагают, что Nehalem был единственной архитектурой первого поколения i7.

Первым в истории Intel Sandy Bridge получил и именование разблокированных процессоров — букву К в названии модели, означающую свободный множитель (как это любила делать AMD сначала в процессорах серии Black Edition, а затем и вовсе повсеместно). Но, как и в случае с SMT, доступна такая роскошь была лишь за дополнительную плату и исключительно на нескольких моделях.

Помимо классической линейки в арсенале Sandy Bridge были и процессорами с приписками T и S, ориентированные на сборщиков компьютеров и портативные системы. Ранее этот сегмент в Intel всерьез не рассматривали.
С изменениями в работе множителя и шины BCLK Intel заблокировала возможность разгона моделей Sandy Bridge без индекса K, прикрыв таким образом лазейку, прекрасно работающую еще в Nehalem. Отдельной сложностью для пользователей стала система «ограниченного разгона», позволявшая выставлять значение частоты Turbo для процессора, лишенного прелестей разблокированной модели. Принцип работы повышения частоты «из коробки» остался неизменным с Lynnfield — при использовании одного ядра система выдает максимально доступную (с учетом охлаждения) частоту, а если процессор полностью загружен, то разгон будет существенно ниже, но по всем ядрам.

Ручной разгон разблокированных моделей, напротив, вошел в историю благодаря тем цифрам, которые позволял достигать Sandy Bridge даже в паре с простейшим комплектным кулером. 4.5 ГГц без трат на охлаждение? Прежде так высоко еще никто не прыгал. Не говоря уже о том, что даже 5 ГГц были уже достижимы с точки зрения разгона при наличии адекватного охлаждения.
Вместе с архитектурными новшествами Sandy Bridge сопровождали и технические новинки — новая платформа LGA1155, снабженная поддержкой SATA 6 Гб/с, появление UEFI-интерфейса для BIOS, и другие приятные мелочи. Обновленная платформа получила нативную поддержку HDMI 1.4а, Blu-Ray 3D и DTS HD-MA, благодаря чему в отличие от десктопных решений на базе Westmere (ядра Clarksdale) Sandy Bridge не испытывал неприятных сложностей при выводе видео на современные телевизоры и воспроизведении фильмов при частоте 24 кадров, что несомненно порадовало любителей домашних кинотеатров.

Впрочем, еще лучше дела обстояли с программной точки зрения, ведь именно с выходом Sandy Bridge Intel представили свою известную технологию декодирования видео ресурсами CPU — Quick Sync, показавшую себя лучшим решением при работе с видео. Игровая производительность Intel HD Graphics, конечно же, не позволяла заявить о том, что нужда в видеокартах теперь в прошлом, однако и сама Intel справедливо отмечала, что для GPU стоимостью в 50 долларов и меньше их графический чип может стать серьезным конкурентом, что было недалеко от правды — на время выхода Intel демонстрировала производительность графического ядра 2500k на уровне HD5450 — наиболее доступной графической карты AMD Radeon.
Intel Core i5 2500k считается, пожалуй, самым народным процессором. Это неудивительно, ведь благодаря разблокированному множителю, припою под крышкой и небольшому тепловыделению он стал настоящей легендой в среде оверклокеров.

Игровая производительность Sandy Bridge вновь подчеркнула тренд, заданный Intel в предыдущем поколении — предложить пользователю производительность уровня лучших решений Nehalem, стоивших по 999$. И у синего гиганта всё получилось — за скромную сумму в чуть более чем 300 долларов пользователь получал производительность, сравнимую с i7 980X, что еще полгода назад казалось немыслимым. Да, новые горизонты производительности не покорились третьему (или второму?) поколению процессоров Core, как это было с Nehalem, но значительное удешевление заветных топ-решений позволило стать поистине «народным» выбором.

image
Intel Core i5–2500k

Кажется, настало самое время для дебюта AMD с их новой архитектурой, однако дожидаться появления настоящего конкурента пришлось несколько дольше — с триумфальным релизом Sandy Bridge в арсенале красного гиганта присутствовала лишь немного расширенная линейка Phenom II, дополненная решениями на ядрах Thuban — небезызвестными шестиядерными процессорами X6 1055 и 1090T. Эти процессоры, несмотря на небольшие архитектурные изменения, могли похвастаться лишь возвращением технологии Turbo Core, в которой принцип настройки разгона ядер вновь вернулся к индивидуальной настройке каждого из них, как это было в оригинальных Phenom. Благодаря подобной гибкости стал возможен как наиболее экономичный режим работы (с падением частоты ядер в idle-режиме до 800 МГц), так и агрессивный производительный профиль (разгон ядер на 500 МГц выше заводской частоты). В остальном же Thuban ничем не отличался от младших братьев по серии, и два его дополнительных ядра служили скорее маркетинговой фишкой AMD, предлагавшей больше ядер за меньшие деньги.

image

Увы, большее число ядер отнюдь не означало большей производительности — в игровых тестах X6 1090T стремился к уровню младших Clarksdale, лишь в некоторых случаях оспаривая показатели i5 750. Низкая производительность на ядро, 125 Вт энергопотребления и другие классические недостатки архитектуры Phenom II, все еще пребывающей на 45 нм, не позволили красным навязать жесткую конкуренцию первому поколению Core и его обновленным собратьям. А с выходом Sandy Bridge актуальность X6 фактически сошла на нет, оставшись интересной лишь для узкого круга профессиональных пользователей-фанатов.
Громогласный ответ AMD на новинки от Intel последовал лишь в 2011 году, когда была представлена новая линейка процессоров AMD FX на архитектуре Bulldozer. Вспомнив о самой удачной серии своих процессоров, AMD не стала скромничать, и в очередной раз подчеркнула невероятные амбиции и планы на будущее — новое поколение обещало, как и прежде, больше ядер для десктопного рынка, инновационную архитектуру, и, конечно же, невероятную производительность в категории price-to-performance.

image

С точки зрения архитектуры Bulldozer выглядел смело — модульная компоновка ядер в четырех блоках на общем L3-кэше в идеальных условиях была призвана обеспечить оптимальную работу в многопоточных задачах и приложениях, однако из-за стремления сохранить совместимость со стремительно стареющей платформой AM2 в AMD решили сохранить под крышкой процессора контроллер северного моста, создав для себя одну из важнейших проблем на последующие годы.

image
Кристалл Bulldozer

Несмотря на 4 физических ядра, процессоры Bulldozer предлагались пользователям как восьмиядерные — это было связано с наличием двух логических ядер в каждом вычислительном блоке. Каждый из них мог похвастаться собственным массивным кэшем L2 в 2 Мб, декодером, буфером инструкций в 256 Кб и блоком выполнения операций с плавающей запятой. Такое разделение функциональных частей позволило обеспечивать обработку данных в восемь потоков, подчеркивая акценты новой архитектуры на обозримое будущее. Bulldozer получил поддержку SSE4.2 и AESNI, а один FPU-блок на каждое физической ядро стал способен выполнять 256-битные AVX-инструкции.

К несчастью для AMD, Intel уже представила Sandy Bridge, поэтому требования к процессорной части серьезно возросли. По цене значительно ниже X6 1090T средний пользователь мог приобрести великолепный i5 2500k, получив производительность уровня лучших предложений прошлого поколения, и красным необходимо было поступить также. Увы, реалии времен релиза имели на этот счет свое мнение.

Уже 6 ядер старших Phenom II были наполовину свободны в большинстве случаев, что уж говорить о восьми потоках AMD FX — из-за специфики подавляющего большинства игр и приложений, использующих 1–2 потока, изредка до 4 потоков, новинка красного лагеря оказалась лишь чуть быстрее предыдущих Phenom II, безнадежно уступив 2500k. Несмотря на некоторое преимущество в профессиональных задачах (к примеру, в архивации данных), флагманский FX-8150 оказался неинтересен потребителю, уже ослепленному мощью i5 2500k. Революции не случилось, а история не повторилась. Стоит упомянуть о встроенном синтетическом тесте WinRAR, который был многопоточным, в то время как в реальной работе архиватор полноценно использовал только два потока.

Еще один мост. Ivy Bridge или пребывая в ожидании


Пример AMD стал показательным во многих вещах, но в первую очередь подчеркнул необходимость создания некоего базиса, на котором можно выстроить успешную (во всех отношениях) процессорную архитектуру. Именно так в эпоху K7/K8 AMD стали лучшими из лучших, и именно благодаря тем же постулатам их место заняла Intel с выходом Sandy Bridge.

Архитектурные изыски оказались ни к чему, когда в руках синих появилась беспроигрышная комбинация — мощные ядра, умеренный TDP и отработанный формат платформы на кольцевой шине, невероятно быстрой и эффективной для любых задач. Теперь оставалось лишь закрепить успех, использовав все, что было прежде — и именно таким успехом и стал переходный Ivy Bridge, третье (как заявляет Intel) поколение процессоров Core.
Пожалуй, самым значительным изменением с точки зрения архитектуры стал переход Intel на 22 нм — не скачок, но уверенный шаг к уменьшению размера кристалла, который вновь оказался меньше предшественника. К слову, размер кристалла процессора AMD FX-8150 при старом техпроцессе 32 нм составлял 315 мм2, в то время как у процессора Intel Core i5–3570 имел размер более чем вдвое меньший: 133 мм2.

image

На этот раз Intel вновь сделала ставку на бортовую графику, и отвела под неё больше места на кристалле — правда, лишь немногим больше. Остальная топология кристалла изменений не претерпела — все те же четыре блока ядер с общим блоком L3-кэша, контроллером памяти и контроллером системных I/O. Можно сказать, схема выглядит пугающе идентичной, но в этом и была суть платформы Ivy Bridge — сохранить лучшее от Sandy, при этом добавив плюсов в общую копилку.

image
Кристалл Ivy Bridge

Благодаря переходу на более тонкий техпроцесс Intel смогла снизить общее энергопотребление процессоров до 77 Вт — с 95 на предыдущем поколении. Тем не менее, надежды на еще более выдающиеся результаты в разгоне не оправдалась — из-за капризной натуры Ivy Bridge достижение высоких частот требовало бОльших напряжений, чем в случае с Sandy, поэтому ставить рекорды на этом семействе процессоров особенно не спешили. Также не лучшую роль для разгона сыграла замена термоинтерфейса между термораспределительной крышкой процессора и его кристаллом с припоя на термопасту.
К счастью для владельцев предыдущего поколения Core, сокет изменений не претерпел, и новый процессор можно было без труда установить в прежнюю материнскую плату. Тем не менее, новые наборы логики предлагали такие изыски, как поддержка USB 3.0, поэтому пользователи, следящие за технологическими новинками, наверняка поспешили приобрести новую плату на Z-чипсете.

Общая производительность Ivy Bridge выросла не столь значительно, чтобы назвать это очередной революцией, а скорее последовательно. В профессиональных задачах 3770k показывал результаты, сравнимые с профессиональными процессорами X-серии, а в играх опережал бывших фаворитов 2600k и 2700k с разницей около 10%. Кто-то сочтет это недостаточным для апгрейда, но Sandy Bridge не просто так считается одним из самых долгоиграющих процессорных семейств в истории.
Наконец, даже самые экономные пользователи ПК-гейминга смогли почувствовать себя на передовой — Intel HD Graphics 4000 оказалась значительно быстрее предыдущего поколения, показав средний прирост в 30–40%, а также получив поддержку DirectX 11. Теперь можно было играть в популярные игры на средне-низких настройках, получая неплохую производительность.

Подводя итоги, можно сказать, что Ivy Bridge стал приятным дополнением для семейства Intel, избежав всевозможных рисков от архитектурных излишеств, и следуя принципу «тик-так», от которого синие впоследствии не отходили вовсе. Красные же предприняли попытку провести масштабную работу над ошибками в виде Piledriver– нового поколения в старом обличии.
Устаревшие 32 нм не позволяли AMD вершить еще одну революцию, поэтому Piledriver был призван скорректировать недочеты Bulldozer, уделив внимание наиболее слабым сторонам архитектуры AMD FX. Ядра Zambezi сменили Vishera, в которые легли некоторые доработки из решений на базе Triniti — мобильных процессоров красного гиганта, но TDP осталось неизменным — 125 Вт для флагманской модели с индексом 8350. Структурно он был идентичен старшему брату, однако архитектурные доработки и увеличение частоты на 400 МГц позволили наверстать упущенное.

image

Рекламные слайды AMD в преддверии выхода Bulldozer обещали поклонникам марки по 10–15% прироста производительности от поколения к поколению, но выход Sandy Bridge и огромный скачок вперед не позволил назвать эти обещания слишком амбициозными — теперь на прилавках уже лежали Ivy Bridge, отодвинувшие верхнюю границу порога производительности еще дальше. Чтобы не допустить ошибку снова, AMD представили Vishera в качестве альтернативы бюджетной части линейки Ivy Bridge — 8350 стал противопоставляться i5–3570K, что было обусловлено не только осторожностью красных, но и ценовой политикой компании. Флагманский Piledriver стал доступен публике за 199$, что сделало его дешевле потенциального конкурента — впрочем, сказать того же о производительности однозначно не получалось.

Профессиональные задачи стали для FX-8350 наиболее ярким местом раскрытия потенциала — ядра работали максимально быстро, и в некоторых случаях новинка от AMD опережала даже 3770k, но там, куда смотрело большинство пользователей (игровая производительность), процессор показывал результаты, схожие с i7–920, а в лучшем случае не слишком отставал от 2500k. Впрочем, такое положение вещей никого не удивило — 8350 был на 20% производительнее 8150 в тех же задачах, при этом TDP остался без изменений. Работа над ошибками удалась — пусть и не так ярко, как многим бы хотелось.

Мировой рекорд разгона про

© Habrahabr.ru