Обзор процессора AMD A10-7850K (Kaveri): самый быстрый из APU
Выпуск процессоров Kaveri — это, вне всяких сомнений, самый главный анонс AMD в этом году. Вместе с новым поколением APU — процессоров, гармонично объединяющих ресурсы параллельных графических и скалярных вычислительных ядер, — компания представляет и гораздо более совершенную стратегию их совместного использования. С этой точки зрения Kaveri очень далеко ушли от первого поколения APU, Llano, которое было представлено в 2011 году. Сделав ставку на создание высокоинтегрированных гибридных устройств, AMD смогла разработать новый класс процессоров, которые, если всё будет идти по намеченному компанией плану, могут захватить лидерство как минимум в сегменте массовых решений. Именно поэтому запуск Kaveri имеет такое значение: в этой новинке находят применение все ключевые инновации — HSA, hUMA, hQ и прочие, делающие из комбинации представленных в APU разнородных ядер единый сплав.
Но есть и другая сторона: многочисленные пользователи персональных компьютеров на самом деле ждут от AMD не каких-то новых идей, которые, несмотря на всю их кажущуюся продуктивность, способны «выстрелить» лишь в перспективе и при условии их широкой поддержки со стороны разработчиков программного обеспечения, а простых процессоров с хорошей вычислительной производительностью. В течение последних нескольких лет AMD заметно отстала от своего основного конкурента в разработке процессорных микроархитектур и утратила возможность выпуска CPU верхней ценовой категории. Kaveri же даёт надежду, что предложения AMD смогут закрепиться хотя бы в среднем ценовом сегменте, ведь в них нашла применение новая и усовершенствованная модификация микроархитектуры Bulldozer — Steamroller. И пока HSA представляет интерес главным образом для разработчиков, простые пользователи рассчитывают на то, что Kaveri даст им возможность выбора платформы при следующем походе в компьютерный магазин.
К сожалению, по результатам нашего первого знакомства с процессорами Kaveri о новых чипах сложилось не слишком благоприятное впечатление. На фоне отказа AMD от дальнейшего развития производительных процессоров серии FX (хочется надеяться, что всё-таки временного) новые APU показали свою полную неспособность соперничать с классическими CPU средней и верхней ценовой категорий в плане вычислительной производительности. А это значит, что интеловские процессоры класса Core i5 и Core i7 норовят стать безальтернативным вариантом в том случае, если речь идёт о построении системы, оборудованной хорошей дискретной видеокартой. Однако столь нелицеприятные для AMD выводы нельзя было считать окончательными, так как они были сделаны нами при тестировании лишь средней модели в линейке Kaveri, A8–7600, которую по какой-то причине представительство AMD предоставило нам вместо флагманской модификации.
Сегодня же мы имеем шанс скорректировать наше мнение и дать окончательный ответ на вопрос о том, могут ли Kaveri претендовать на нечто большее, чем присутствие в недорогих компьютерах, опирающихся на использование небыстрой, встроенной в процессор графики. Для этого мы подробно протестировали старшую десктопную модель Kaveri, A10–7850K, которую AMD позиционирует в качестве альтернативы четырёхъядерным процессорам конкурента семейства Core i5.
⇡#Подробнее о AMD A10–7850K
Подробно о том, чем отличаются процессоры Kaveri от предшествующих поколений APU компании AMD, мы говорили в нашем обзоре A8–7600. Поэтому здесь мы не будем ещё раз останавливаться на архитектурных тонкостях, а лишь напомним основные моменты применительно к сегодняшнему главному герою, процессору A10–7850K.
Процессоры Kaveri представляют собой объединённые на общем полупроводниковом кристалле четыре x86-ядра (скомпонованных в два модуля) с микроархитектурой Steamroller, графическое ядро поколения GCN и северный мост, содержащий контроллер памяти и контроллер графической шины PCI Express 3.0. Сам полупроводниковый кристалл Kaveri изготавливается по новой для процессорной продукции AMD 28-нм технологии на предприятии GlobalFoundries.
Следует подчеркнуть, что технологический производственный процесс, применяемый в данном случае, является APU-оптимизированным. Это означает, что при тонкой настройке техпроцесса приоритет отдан не максимальному частотному потенциалу, а повышению плотности размещения транзисторов с целью интеграции как можно большего массива параллельных графических шейдеров. В итоге на кристалле площадью 245 мм2 уместилось 2,41 млрд транзисторов, 47 процентов которых участвует в работе графического ядра. Это означает, что по удельной плотности размещения транзисторов Kaveri заметно превосходит Haswell и приближается к современным графическим ускорителям. Однако такой подход к проектированию потребовал от AMD занизить тактовые частоты процессорной части. Номинальной частотой для старшей модели Kaveri, A10–7850K, стала 3,7 ГГц, что на 400 МГц ниже частоты, достигнутой в APU поколения Richland.
Падение вычислительной производительности, вызванное снижением частоты, AMD скомпенсировала микроархитектурными улучшениями, внедрёнными в Steamroller. Инженеры выявили наиболее критичные узкие места двухъядерных модулей Piledriver и попытались по возможности их ликвидировать. Хотя основа микроархитектуры осталась нетронутой, и вычислительные ядра в Kaveri так же, как и раньше, попарно объединены в модули с двумя комплектами целочисленных исполнительных устройств, но разделяемым FPU, изменений было сделано немало. Самое главное: каждое из ядер получило собственный независимый декодер инструкций, в то время как в Piledriver на двухъядерный модуль приходился один декодер. В результате микроархитектура Steamroller увеличила свою эффективность за счёт лучшей загрузки исполнительных устройств, в особенности целочисленных, собственный комплект которых есть в каждом ядре. Попутно были выполнены и другие оптимизации: объём кеша инструкций увеличился с 64 до 96 Кбайт;, а качество работы блока предсказания переходов улучшилось на 20 процентов за счёт роста объёма буферов. Кроме того, в Steamroller удвоена пропускная способность ядер на операциях сохранения данных.
Но графическая часть процессоров Kaveri изменилась ещё сильнее. Главное: она переведена на самую современную архитектуру GCN 1.1, которая используется актуальной линейкой видеокарт Hawaii. При этом максимальная версия графического ядра, которая реализована в A10–7850K, получила в своё распоряжение 512 шейдеров, которые разделены по восьми вычислительным кластерам. За счёт этого производительность графического движка в очередной раз выросла, так как в старших версиях Richland присутствовало не более 384 шейдеров с архитектурой VLIW4. С точки же зрения мощности графического ядра процессор A10–7850K можно сравнивать с Radeon HD 7750, и это позволяет надеяться, что этот APU даст возможность строить интегрированные игровые системы с приемлемой для многих пользователей производительностью.
Однако мощное видеоядро Kaveri предназначается не только для 3D-графики. Не имея возможности предложить пользователям производительные x86-ядра, с выходом процессоров Kaveri AMD решила делать особый упор на счётную производительность графики и гетерогенные вычисления. Для этого компания активно продвигает парадигму HSA (Heterogeneous System Architecture — «гетерогенная системная архитектура»). Графическое ядро Kaveri содержит восемь асинхронных вычислительных движков Asynchronous Compute Engines (ACE), каждый из которых может загружать шейдерные кластеры независимыми счётными задачами и имеет собственный доступ к кеш-памяти. То есть графические вычислительные кластеры получили равноправный с x86-ядрами доступ к системной памяти, и теперь AMD предлагает считать их самостоятельными процессорными ядрами.
Такой подход имеет право на жизнь, так как благодаря HSA вычислительные кластеры действительно могут выполнять собственные процессы вне зависимости от других ядер, не требуя какой-либо активности от x86-ядер. Поэтому, например, A10–7850K, располагающий четырьмя вычислительными ядрами и восемью графическими кластерами, производитель продвигает как 12-ядерный гетерогенный процессор. Однако следует понимать, что эти 12 ядер не эквивалентны, они нуждаются в различном программном коде, и операционная система увидит в A10–7850K лишь четыре традиционных x86-ядра. За загрузку же вычислительной работой шейдерных кластеров несут ответственность разработчики программ, которые должны будут внедрить в свои продукты специализированный OpenCL-код. Иными словами, хоть AMD и преподносит Kaveri как многоядерные процессоры с гетерогенной архитектурой, пока о них можно говорить лишь как о четырёхъядерных CPU с мощным OpenCL-совместимым графическим ядром, способным исполнять параллельные вычисления.
Семейство процессоров Kaveri для настольных компьютеров делится на две подгруппы: энергоэффективные модели с тепловым пакетом 45/65 Вт и обычные модификации, имеющие типичное расчётное тепловыделение на уровне 95 Вт. С представителями первой подгруппы мы уже знакомились на примере A8–7600, и, как показало тестирование, они оказались не слишком привлекательными для пользователей, заинтересованных в построении производительных систем. Главный же герой настоящего обзора — старший 95-ваттный процессор Kaveri, A10–7850K. Если сравнить эту модель с предыдущими флагманскими APU, процессорами A10–6800K и A10–5800K поколения Richland и Trinity, получится нижеследующая таблица.
AMD A10–7850K AMD A10–6800K AMD A10–5800K Кодовое имя Kaveri Richland Trinity Ядра 4 ядра (2 модуля) 4 ядра (2 модуля) 4 ядра (2 модуля) Микроархитектура Steamroller Piledriver Piledriver Процессорный разъём Socket FM2+ Socket FM2/FM2+ Socket FM2/FM2+ Разблокированный множитель Есть Есть Есть Тактовая частота 3,7 ГГц 4,1 ГГц 3,8 ГГц Частота в турборежиме До 4,0 ГГц До 4,4 ГГц До 4,2 ГГц L2-кеш 2×2 Мбайт 2×2 Мбайт 2×2 Мбайт Графическое ядро Radeon R7 Radeon HD 8670D Radeon HD 7660D Архитектура GPU GCN VLIW4 VLIW4 Шейдерные процессоры 512 384 384 Частота GPU 720 МГц 844 МГц 800 МГц Поддержка DDR3 DDR3–2133 DDR3–2133 DDR3–1866 TDP 95 Вт 100 Вт 100 Вт Средняя цена, руб. 6 900 5 100 4 000 К сожалению, отсутствие признаков явного превосходства Kaveri над предшественниками в приведённой таблице — это отражение реальности. Новый флагманский гибридный процессор, A10–7850K, рядом с Richland хорошо смотрится лишь в части графического ядра. На фоне 15-процентного снижения частоты графики число шейдерных процессоров выросло на треть, плюс сменилась на более совершенную версию и их внутренняя архитектура, что дополнительно привнесло и увеличение числа текстурных блоков. Всё это позволяет надеяться, что встроенная в A10–7850K графика сможет с полным правом претендовать на роль игрового решения начального уровня. Если, конечно, её производительность не упрётся в пропускную способность двухканальной DDR3-памяти, процессорный контроллер которой в Kaveri не претерпел никаких существенных изменений.
С x86-частью рассматриваемого процессора всё выглядит гораздо грустнее. Тактовая частота снизилась настолько сильно, что по этой характеристике A10–7850K уступает даже A10–5800K. Хочется надеяться, что по мере совершенствования нового 28-нм технологического процесса AMD сможет поднять частоту хотя бы до 4 ГГц. Однако пока можно надеяться лишь на то, что перечисленных выше микроархитектурных усовершенствований в Steamroller хватит, чтобы A10–7850K оказался не медленнее A10–6800K в традиционных программах. Тем более что, как показывает практика, турборежим в новых процессорах не слишком агрессивен, и средняя реальная частота работы A10–7850K при серьёзной многопоточной нагрузке находится на уровне 3,8 ГГц. В моменты же простоя она снижается до 1,7 ГГц.
С учётом всего этого у старшей модели Kaveri очень странно выглядит одна из основных потребительских характеристик — цена. Для A10–7850K AMD установила официальную стоимость на уровне $173, то есть компания позиционирует этот процессор как альтернативу младшим представителям серии Intel Core i5.
Более ранние модификации APU на соперничество с четырёхъядерниками конкурента были явно не способны, и мы их всегда сопоставляли с представителями семейства Core i3. Неужели с выходом Kaveri что-то принципиально изменилось? Или всему виной возросшие амбиции производителя, подогреваемые предстоящим возможным внедрением HSA? Очевидно, пора переходить к тестам.
Следующая страница →
Материалы по теме
Полный текст статьи читайте на 3DNews