Видеоускоритель AMD Radeon VII: когда цифры техпроцесса заменяют привычные наименования (базовый обзор с теоретической частью, синтетическими и игровыми тестами)

Справочные материалы:

Теоретическая часть: особенности архитектуры

Прошлый год для графического подразделения компании AMD получился довольно спокойным. Они уже не первый год занимаются сравнительно небольшими модификациями весьма удачной для своего времени архитектуры GCN, но в 2016 году запустили новую линейку Polaris, а в 2017 — Vega. В прошлом же году компания AMD выпустила разве что мобильные версии Vega и очередное обновление топа линейки Polaris в виде Radeon RX 590. Куда более интересными были новые серверные продукты Radeon Instinct MI50 и MI60, ставшие первенцами индустрии в деле освоения техпроцесса 7 нм.

Выход новой игровой видеокарты в начале года — довольно редкое событие, но в компании решили представить новую топовую модель Radeon VII именно на шоу CES 2019 в январе. Естественно, совершенно новый GPU они бы разработать не успели, так что новинка основана на серверном решении, которое используется в линейке Radeon Instinct. Что же нового в «седьмом» Radeon? GPU под кодовым именем Vega 20 очень похож на своего предшественника Vega 10, который был улучшен для повышения конкурентоспособности решений компании, предназначенных для рынка научных вычислений и машинного обучения.

Чуть ли не самым важным в новом графическом процессоре является то, что он произведен по новейшему техпроцессу 7 нм компании TSMC, что позволило AMD немного увеличить сложность чипа, повысить его производительность, а главное — улучшить энергоэффективность. Вполне вероятно, что себестоимость производства нового GPU не позволяла выпустить новинку на рынок игровых решений ранее, но так как конкурент выпустил целую новую линейку видеокарт, то нужно было ответить хоть чем-то.

И поскольку линейка Nvidia GeForce RTX отличается высокими ценами, AMD смогла позволить себе выпустить на игровой рынок GPU с немалой себестоимостью и получать хоть какую-то прибыль даже с такого сложного и дорогого в производстве решения, изначально предназначенного для серверного рынка. Неудивительно, что в AMD решили назначить на Radeon VII такую же цену, как у прямого конкурента — GeForce RTX 2080. И сегодня мы разберемся, насколько это обосновано.

Так как основой рассматриваемой сегодня видеокарты Radeon VII является графический процессор Vega 20, являющийся незначительно модифицированным чипом Vega 10, имеющим архитектуру GCN пятого поколения, схожую с архитектурой более ранних решений компании AMD, то перед прочтением статьи будет весьма полезно ознакомиться с нашими предыдущими материалами по видеокартам компании:

Графический ускоритель Radeon VII
Кодовое имя чипа Vega 20 (улучшенный Vega 10)
Технология производства 7 нм (для Vega 10 — 14 нм)
Количество транзисторов 13,2 млрд (у Vega 10 — 12,5 млрд)
Площадь ядра 331 мм² (у Vega 10 — 495 мм²)
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_1
Шина памяти 4096-битная (у Vega 10 — 2048-битная) шина памяти с поддержкой стандарта High Bandwidth Memory второго поколения
Частота процессора (базовая/турбо/пиковая) 1400/1750/1800 МГц (у Vega 10 —1274/1546/1630 МГц)
Вычислительные блоки 64 вычислительных блока GCN (активных из них 60), состоящих в целом из 4096 ALU (активных 3840) для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы INT4, INT8, INT16, FP16, FP32 и FP64)
Блоки текстурирования 256 блоков (240 активных) текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 64 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра.
Поддержка мониторов поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.4
Спецификации референсной видеокарты Radeon VII
Частота ядра 1400/1750/1800 МГц
Количество универсальных процессоров 3840
Количество текстурных блоков 240
Количество блоков блендинга 64
Эффективная частота памяти 2000 МГц
Тип памяти HBM2
Шина памяти 4096-бит
Объем памяти 16 ГБ
Пропускная способность памяти 1 ТБ/с
Вычислительная производительность (FP16) до 27,6 терафлопс
Вычислительная производительность (FP32) до 13,8 терафлопс
Вычислительная производительность (FP64) до 3,5 терафлопс
Теоретическая максимальная скорость закраски 115 гигапикселей/с
Теоретическая скорость выборки текстур 432 гигатекселя/с
Шина PCI Express 3.0
Разъемы один HDMI и три DisplayPort
Энергопотребление до 300 Вт (у RX Vega 64 — 295 Вт)
Дополнительное питание два 8-контактных разъема
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $699

Название очередной модели видеокарты AMD не соответствует принятой ранее системе наименований. Сегодняшняя новинка снова имеет имя собственное, но в этот раз — римскую цифру после названия семейства Radeon, которая означает… да мало ли что она может означать. Или Vega II, или намек на использование техпроцесса 7 нм. В общем, типичное маркетинговое название. Начальные буквы RX из наименования также исчезли, хотя не так давно AMD они очень нравились, в тех же Radeon RX Vega они есть.

Рассматриваемая сегодня модель Radeon VII занимает в текущей линейке компании место топового решения, и ее рекомендованная цена недвусмысленно намекает на то, что главным конкурентом видеокарты на рынке будет GeForce RTX 2080, имеющая ровно такую же цену. Что ж, тем проще и для рынка, и для нас, а то очень часто производители выставляют среднюю цену между парой решений конкурента и приходится вычислять соотношение цены и производительности. При равных ценах все просто: какая видеокарта функциональнее и быстрее — та и привлекательнее.

Референсный вариант Radeon VII имеет обычный воздушный кулер открытого типа. Внешний вид корпуса сделан в стиле угловатого металлического бруска, который известен со времен модификаций Vega 64 Limited Edition и Liquid, но теперь применяется схема с тремя вентиляторами, привычная по множеству решений различных производителей видеокарт. Естественно, столь мощная система охлаждения важна для видеокарты с потреблением аж в 300 Вт. Хотя это лишь на 5 Вт больше, чем у RX Vega 64, но и сам кристалл GPU стал меньшего размера и к площади добавились еще два стека HBM2-памяти.

Эталонный вариант видеокарты Radeon VII имеет три видеовыхода DisplayPort и один HDMI. По поддержке стандартов вывода никаких изменений в Vega 20 нет. По понятным причинам, видеокарты Radeon VII существуют исключительно в версии с 16 ГБ памяти, что было обусловлено изначальным профессиональным применением Vega 20.

Для дополнительного питания референсная плата использует два 8-контактных разъема, и значение типичного энергопотребления для модели Radeon VII установлено на уровне 300 Вт, что лишь чуть больше, чем у Vega 64. С одной стороны, два разъема питания будут полезны при разгоне, с другой — как бы не получилось так, что по уровню потребления энергии Radeon VII недалеко ушла от Vega 64 при всех преимуществах нового техпроцесса…

Видеокарты модели Radeon VII продаются в референсном виде несколькими партнерами компании. Чтобы дополнительно привлечь игроков, в комплекте с новой топовой видеокартой предлагается сразу три современные игры (две из которых еще даже не вышли): Devil May Cry 5, The Division 2 и Resident Evil 2 (единственная, которая уже вышла — и, к слову, получила высокие оценки прессы и игроков).

Впрочем, эти игры доступны не только с новинкой, но и с Radeon RX 590 и модификациями RX Vega. И даже новоиспеченные покупатели моделей RX 580 и RX 570 смогут выбрать, но уже лишь две игры из трех. Конкурент в лице GeForce RTX 2080 предлагает свой комплект: Anthem, Battlefield V и Metro Exodus, и тут уж каждому решать для себя самостоятельно, какой из них интереснее.

Архитектурные особенности

Графический процессор Vega 20 основан на архитектуре GCN 5, и это почти тот же Vega 10, но с несколькими изменениями, ориентированными на серверные вычисления. Если совсем вкратце, то Vega 20 — это чуть улучшенный Vega 10 архитектуры GCN, произведенный при помощи техпроцесса 7 нм. Благодаря более совершенной технологии производства, 13,2 млрд транзисторов поместились в чип площадью 331 мм², хотя 12,5 млрд транзисторов Vega 10 занимали куда большую площадь в 495 мм².

При переходе производителей GPU на новый техпроцесс часто увеличивается количество исполнительных блоков, поднимающих производительность более нового чипа. В случае Vega 20 разработчики решили обойтись почти неизменным чипом, но со сниженным энергопотреблением и повышенной частотой. В случае с не до конца отлаженным техпроцессом это решение логично, ведь производство столь сложных чипов на ранней стадии жизни техпроцесса слишком рискованно и означает низкий выход годных чипов, а увеличение площади кристалла приведет к слишком большому росту брака. До сих пор на техпроцессе 7 нм у TSMC массово производились только сравнительно небольшие мобильные однокристальные системы, а кристалл Vega 20 куда более сложен.

Давайте наглядно сравним площади чипов семейства Vega двух разных поколений: предыдущего с площадью 495 мм² и нового, уместившегося в 331 мм² благодаря самому совершенному на сегодняшний день техпроцессу:

Именно это снижение размеров кристалла позволило сэкономить место на чипе для того, чтобы поместить на подложку-интерпозер схожего размера еще два стека HBM2-памяти, что привело к росту объема локальной видеопамяти до 16 ГБ. Это не первый GPU компании с таким объемом, был уже вариант Radeon Vega Frontier Edition, но Radeon VII точно является более массовым вариантом.

Удвоенный объем локальной видеопамяти вместе с удвоенной пропускной способностью стали, пожалуй, самым большим изменением в Radeon VII по сравнению с RX Vega 64. Кроме размещения не двух, а четырех стеков HBM2-памяти на интерпозере, также была немного увеличена и частота работы микросхем памяти. Естественно, все это делалось, в основном, для серверных продуктов, ведь в игровых видеокартах такие объемы памяти и ПСП вряд ли актуальны до сих пор.

Наличие 16 ГБ в игровой видеокарте сейчас не является таким уж явным преимуществом: в абсолютном большинстве игр даже при максимальных (без бессмысленного повышения внутреннего разрешения рендеринга до 8К) настройках вполне хватает и 8 ГБ. В консолях большего объема памяти просто нет, так что все мультиплатформенные проекты в таком объеме VRAM не нуждаются, да и ПК-разработчики также не ориентируются на GPU с 16 ГБ по причине их крайней редкости.

Но нужно понимать, что Vega 20 предназначена прежде всего для профессиональной сферы, а там такой объем видеопамяти уже вполне востребован. Более того, даже в варианте Radeon VII он может быть полезен в приложениях по созданию контента, например при обработке видео и в 3D-рендеринге. В таких задачах имеющиеся 16 ГБ будут поглощены с легкостью. Ну, и для игровых применений запас по объему памяти вполне может греть душу, как минимум. Да и с маркетинговой точки зрения 16 всегда лучше, чем 8 или даже 11.

Если говорить о самом кристалле, то графический процессор Vega 20 относится к пятому поколению архитектуры Graphics Core Next, базовым ее блоком является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD. Блок CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков самостоятельно занимается планированием и распределением работы.

На архитектурном уровне графический процессор Vega 20 — это практически полная копия Vega 10 с некоторыми улучшениями и увеличенным количеством контроллеров памяти. Все остальные блоки чипа остались в том же количестве (физически; некоторые из них были отключены конкретно в модели Radeon VII), GPU содержит 64 CU и 256 текстурных модулей (активными из них остались 60 CU и 240 TMU), размещенных в четырех шейдерных движках, также имеется 64 блока ROP и один командный процессор. В итоге, всего в составе активных вычислительных блоков находится 3840 потоковых процессоров (в Vega 64 их 4096) и 240 текстурных блоков (против 256 в Vega 64).

Есть в чипе Vega 20 некоторые улучшения и изменения, направленные на повышение производительности. Одним из них является удвоенная ПСП: каждому исполнительному блоку теперь доступна вдвое более высокая скорость обмена с памятью. С другой стороны, количество блоков ROP в GPU осталось прежним, и поэтому в ограниченных скоростью заполнения играх особого прироста производительности не будет. Зато повышенная ПСП будет полезной для вычислительных задач.

Получается, что между Vega 20 и Vega 10 не так много отличий, и у новинки даже чуть меньше активных вычислительных блоков. Однако для Radeon VII заявлена пиковая тактовая частота в 1800 МГц, хотя официальная турбо-частота несколько ниже: 1750 МГц. Напомним, что у Radeon RX Vega 64 пиковая частота равна 1630 МГц, а кроме того, новый Radeon VII способен дольше работать на более высокой частоте, поддерживая ее чаще, чем предшествующая модель. Так что новинка должна быть в целом явно побыстрее Vega 64.

Поговорим о более явных улучшениях, среди которых — нескольких новых инструкций и типов данных для ускорения задач машинного обучения. Особых деталей AMD публике не выдает, но в Vega 20 они добавили типы данных INT8 и INT4, востребованные в некоторых задачах глубокого обучения, не требующих высокой точности вычислений. Также к возможностям нового GPU добавлена новая инструкция FP16 dot product, предназначенная для алгоритмов глубокого обучения, которая накапливает результат в формате FP32 — с большей точностью по сравнению с типичной инструкцией FP16 dot product.

Еще одно очень важное изменение для серверных процессоров — увеличение производительности вычислений с двойной точностью, FP64. Архитектура GCN позволяет варьировать производительность FP64 от ½ до 1/16 темпа FP32-вычислений, и для игровых решений это значение всегда было самым низким, 1/16, а все серверные GPU имели половинный темп вычислений. В Vega 20 этот темп максимален — ½ от FP32 для FP64. И если по FP32-производительности новый чип не сильно быстрее Vega 10, то по операциям с двойной точностью увеличение производительности уже более 8 раз.

Но это касается профессиональных решений, а в Radeon VII ожидали те же 1/16. Однако AMD и тут решила дать пользователям новые возможности, ограничив скорость FP64 для видеокарты Radeon VII на уровне ¼ от скорости FP32, что очень прилично и может быть востребовано для многих серьезных вычислительных применений. Конечно, обеспеченные профессионалы в любом случае предпочтут Radeon Instinct, но в ряде задач вполне можно будет обойтись и игровым Radeon VII.

По спецификациям Radeon VII соответствует серверной модели Radeon Instinct MI50, но чтобы продажи игрового GPU не ударили по более серьезному рынку, в AMD решили слегка ограничить вычислительные возможности Vega 20 искусственным образом, не только снизив производительность вычислений с двойной точностью (FP64), но и отключив поддержку коррекции ошибок ECC для чипа. Впрочем, для части полу- и профессиональных применений Radeon VII все равно подходит куда лучше других игровых GPU.

И пусть Radeon VII не так быстр в FP64-вычислениях, как Radeon Instinct MI60 и MI50, но 3,5 терафлопс дают новой модели большое преимущество в определенных задачах, использующих именно такую точность вычислений. И на данный момент у новинки не существует конкурентов в этом смысле, все Nvidia GeForce и остальные AMD Radeon имеют крайне низкую FP64-производительность, а Titan V стоит вчетверо дороже. Конечно, мы говорим о маленькой нише на большом рынке, но некоторые исследователи точно будут довольны.

Для разделения рынков Radeon VII также был ограничен по возможностям внешних связей. Технически, Vega 20 имеет поддержку PCI Express 4.0 (к слову, это в принципе первый GPU с поддержкой новой версии PCIe), но лишь в вариантах Radeon Instinct, а работа Radeon VII ограничена скоростями PCI Express 3.0. То же самое касается возможностей внешних линков Infinity Fabric для многочиповых конфигураций: в Instinct они есть, а в Radeon VII отключены. Также новинка не поддерживает привычный CrossFire — только работу многочиповых систем в пределах возможностей DirectX 12 и Vulkan, для чего нужна поддержка со стороны разработчиков игровых приложений.

Абсолютно все остальные функциональные возможности Vega 10 поддерживаются и новым GPU, включая удвоенный темп для FP16-инструкций (используется в Far Cry 5 и Wolfenstein II, если говорить об играх), Draw Stream Binning Rasterizer (DSBR) и так и не заработавшие в реальности шейдеры примитивов (primitive shaders), требующие поддержки как со стороны драйверов, так и игровых разработчиков. С точки зрения поддержки устройств вывода и видеокодирования и декодирования, в Vega 20 изменений тоже практически нет: технически, блоки вроде бы обновились, но никаких новых возможностей по сравнению с Vega 10 у них не появилось.

Зато была улучшена работа с отслеживанием температуры всего GPU. По заявлениям AMD, в новом чипе содержится вдвое большее количество температурных датчиков — уже 64 штуки. Это позволяет точно контролировать температуру всего чипа, а не только в каких-то областях, и с несколько большей точностью. Одно это изменение привело к дополнительному приросту на 1%-2% в производительности за счет меньшего времени работы графического процессора в режиме тротлинга. Данные с температурных датчиков и GPU теперь считываются иным образом и требуют обновления соответствующего ПО для поддержки новых вызовов API AMD.

Со всеми остальными возможностями чипов семейства Vega, которые в Radeon VII ничуть не изменились, вы можете познакомиться в базовом обзоре видеокарты Radeon RX Vega 64, там они описаны во всех подробностях.

Предварительная оценка производительности и промежуточные выводы

Прежде чем делать какие-то наметки по производительности Radeon VII, для начала давайте сравним характеристики нескольких моделей видеокарт AMD, включив в таблицу два варианта игровых решений на разных поколениях чипа Vega и самую лучшую видеокарту семейства Polaris:

  Radeon VII Radeon RX Vega 64 AMD Radeon RX 590
Техпроцесс TSMC, 7 нм GloFo, 14 нм GloFo, 12 нм
Кодовое наименование GPU Vega 20 Vega 10 Polaris 30
Архитектура GCN 5 GCN 5 GCN 4
Количество транзисторов, млрд 13,2 12,5 5,7
Площадь кристалла, мм² 331 495 232
Количество блоков ALU 3840 4096 2304
Количество блоков TMU 240 256 144
Количество блоков ROP 64 64 32
Базовая частота, МГц 1400 1247 1469
Турбо частота, МГц 1750 1546 1545
Частота видеопамяти, МГц 2000 1890 8000
Ширина шины видеопамяти, бит 4096 2048 256
Объем видеопамяти, ГБ 16 8 8
Производительность FP32, TFLOPS 13,8 12,7 7,1
Производительность FP64, TFLOPS 3,5 0,8 0,4
Энергопотребление, Вт 300 295 225
Рекомендованная цена, $ 699 499 279

Из таблицы видно, что сегодняшняя новинка по теоретической пиковой производительности отличается от Vega 64 не так уж сильно. В явных преимуществах у нее больший объем памяти и ПСП, а вот производительность вроде бы не должна сильно отличаться. При этом в теории Radeon VII до двух раз быстрее Radeon RX 590, что мы дальше проверим уже на практике.

Если говорить о данных самой компании AMD, то по игровой производительности новая модель Radeon VII практически во всех современных играх дает значительный прирост частоты кадров по сравнению с предыдущими продуктами компании из этого рыночного сегмента, да и по сравнению с конкурирующими продуктами предыдущего поколения новинка смотрится довольно неплохо. Вот диаграмма игровой производительности Radeon VII по сравнению с Radeon RX Vega 64 и GeForce GTX 1080:

Как видите, по измерениям специалистов из AMD, их новое детище опережает как предыдущую модель этой же компании, так и ее давнего конкурента. По этим данным, Radeon VII оказалась значительно быстрее парочки представителей GPU прошлых лет, но зачем сравнивать новинку с устаревшими видеокартами? А что получится, если сравнить рассматриваемый сегодня продукт со свежим конкурентом в виде GeForce RTX 2080, который продается по той же цене?

Судя по измерениям, проведенным в широком наборе самых популярных игровых приложений, хорошо подготовленный для высоких разрешений Radeon VII смотрится очень неплохо по сравнению с прямым конкурентом GeForce RTX 2080, как минимум при использовании 4K-разрешения. Да, кое-где новинка уступает видеокарте Nvidia, но в других играх значительно опережает, а в среднем они где-то на одном уровне. Всё это, повторим, по данным AMD и в выгодных для них условиях.

Собственные игровые тесты мы проведем чуть позже, а сейчас напомним важный момент: Radeon VII предназначен не только для любителей игр, но и для любителей и профессионалов, занимающихся созданием цифрового контента в 3D-пакетах и ПО для видеоредактирования, научными вычислениями и так далее. К примеру, в Blender (это популярное ПО для рендеринга, использующее возможности GPU AMD при помощи плагина Radeon ProRender), а также DaVinci Resolve и Adobe Premiere (это ПО для редактирования видеороликов, их цветокоррекции и наложения визуальных эффектов) в сложных задачах типа редактирования 4K- и 8K-видео используется более восьми гигабайт видеопамяти, и Radeon VII здесь раскрывает свои возможности, опережая Vega 64 примерно на 25%-30% и показывая производительность примерно на уровне GeForce RTX 2080 или даже выше.

Довольно важным преимуществом Radeon VII в этих случаях является наличие 16 ГБ сверхбыстрой HBM2-памяти с шириной шины в 4096-бит и пропускной способностью в 1 ТБ/с. И для современных игр при максимальных настройках графики и ультравысоких разрешениях рендеринга это может быть полезно. Так, рекомендуемые требования к объему видеопамяти у популярной серии игр Battlefield менее чем за десяток лет выросли с 0,5–1 ГБ в 2010—2011 гг. до 6–8 ГБ для последней игры серии — Battlefield V.

Замеры специалистов компании AMD, проведенные с использованием такого ПО, как MSI Afterburner и Windows Task Manager, показали, что популярные игровые и профессиональные приложения в разрешении 4K и выше используют больше 8 ГБ видеопамяти, имеющихся в наличии у большинства решений ценового диапазона, в котором выступает Radeon VII, вроде ее прямого конкурента — GeForce RTX 2080.

Так, при редактировании видеороликов высокого разрешения в Adobe Premiere используется 10—12 ГБ видеопамяти, а в играх иногда отмечается использование 11—13 ГБ локальной памяти GPU. Другое дело, что большие цифры объема используемой памяти вовсе не говорят о том, что объема 8 ГБ будет недостаточно: современные игры зачастую используют стриминг текстур и других ресурсов и просто забивают данными максимально возможный объем памяти, пока она есть в наличии. То есть если при 16 ГБ у Radeon VII будет использоваться 11—12 ГБ, то на GeForce RTX 2080 может вполне хватать и 8 ГБ. Сам по себе объем занятой VRAM не значит ничего.

Тем более, что в AMD сделали хитро, добавив значения используемого объема видеопамяти при использовании таких настроек, как повышенное разрешение рендеринга (к примеру, при выводе в 4K-разрешении сам рендеринг производится при 8K-разрешении), при довольно низкой частоте кадров. Впрочем, при достаточно высоком FPS также есть вероятность того, что при нехватке видеопамяти на GPU с меньшим ее объемом будут наблюдаться неприятные рывки при подгрузке данных из ОЗУ, тогда как Radeon VII предоставит их быстрее — уже загруженными в быструю видеопамять. Такая ситуация показана на диаграмме времени рендеринга кадров:

Сравнение данных Radeon VII и GeForce RTX 2080 показывает, что с видеокартой AMD наблюдается гораздо меньше подгрузок данных, когда частота кадров падает до неприятных притормаживаний, и игровой процесс в целом достаточно плавный, а вот GeForce при нехватке локальной видеопамяти частенько лезет за не поместившимися в видеопамять данными в ОЗУ, что вызывает некомфортные подергивания картинки (зеленые пики на графике).

Такое поведение разных видеокарт не будет видно по средним значениям частоты кадров, но даже при беглом взгляде на диаграмму времени отрисовки кадров оно сразу становится очевидно. По данным AMD, их видеокарты справляются с задачей обеспечения плавности лучше конкурента, но чтобы подтвердить это, нужно проводить отдельное серьезное исследование. В любом случае, больше видеопамяти точно лучше, чем меньше.

Особенности видеокарты

Объект исследования: ускоритель трехмерной графики (видеокарта) AMD Radeon VII 16 ГБ 4096-битной HBM2

Сведения о производителе: Компания ATI Technologies (торговая марка ATI) основана в 1985 году в Канаде как Array Technology Inc. В том же году была переименована в ATI Technologies. Штаб-квартира в г. Маркхам (Торонто). C 1987 года компания сконцентрировалась на выпуске графических решений для ПК. Начиная с 2000 года основным брендом графических решений ATI становится Radeon, под которым выпускаются GPU как для настольных ПК, так и для ноутбуков. В 2006 году компанию ATI Technologies покупает компания AMD, в которой образуется подразделение AMD Graphics Products Group (AMD GPG). C 2010 года AMD отказывается от бренда ATI, оставив лишь Radeon. Штаб-квартира AMD в Саннивейл (Калифорния), а у AMD GPG остается главным офисом бывший офис AMD в Маркхаме (Канада). Своего производства нет. Общая численность сотрудников AMD GPG (включая региональные офисы) — около 2000 человек.

Характеристики карты

AMD Radeon VII 16 ГБ 4096-битной HBM2
GPU Radeon VII (Vega20)
Интерфейс PCI Express x16
Частота работы GPU (ROPs), МГц 1400—1750(Boost)—1803(Max)
Частота работы памяти (физическая (эффективная)), МГц 1000 (2000)
Ширина шины обмена с памятью, бит 4096
Число вычислительных блоков в GPU 60
Число операций (ALU) в блоке 64
Суммарное количество блоков ALU 3840
Число блоков текстурирования (BLF/TLF/ANIS) 240
Число блоков растеризации (ROP) 64
Число блоков Ray Tracing
Число тензорных блоков
Размеры, мм 270×105×40
Количество слотов в системном блоке, занимаемые видеокартой 2
Цвет текстолита черный
Энергопотребление пиковое в 3D, Вт 305
Энергопотребление в режиме 2D, Вт 20
Энергопотребление в режиме «сна», Вт 10
Уровень шума в 3D (максимальная нагрузка), дБА 46,0
Уровень шума в 2D (просмотр видео), дБА 21,7
Уровень шума в 2D (в простое), дБА 21,7
Видеовыходы 1×HDMI 2.0b
3×DisplayPort 1.4
Поддержка многопроцессорной работы CrossFire (под вопросом)
Максимальное количество приемников/мониторов для одновременного вывода изображения 4
Питание: 8-контактные разъемы 2
Питание: 6-контактные разъемы 0
Максимальное разрешение/частота, Display Port 3840×2160@160 Гц (7680×4320@30 Гц)
Максимальное разрешение/частота, HDMI 3840×2160@60 Гц
Максимальное разрешение/частота, Dual-Link DVI 2560×1600@60 Гц (1920×1200@120 Гц)
Максимальное разрешение/частота, Single-Link DVI 1920×1200@60 Гц (1280×1024@85 Гц)
Средняя цена в продаже отсутствует (на момент публикации)

Особенности карты и сравнение с AMD Radeon RX Vega 64

AMD Radeon VII AMD Radeon RX Vega 64
вид спереди
вид сзади

Поскольку Radeon VII является прямым наследником Vega 64, интересно сравнить именно с Vega 64. К тому же GPU Vega20 (Radeon VII) — это, по сути, обновленный с переходом на новый техпроцесс Vega10 (RX Vega64). Архитектура почти та же самая, есть изменения в частотах, кешах, шине обмена с памятью.

Очевидно, что печатные платы схожи в размерах и расположении элементов. Это связано, скорее всего, с необходимостью размещения довольно сложной системы питания, а также установки довольно габаритной системы охлаждения, поэтому, несмотря на отсутствие на печатной плате мест под отдельные микросхемы памяти, PCB все же получилась большой. Помнится, среди всего семейства GPU, оснащенных HBM-памятью, только Fury Nano мог похвастаться очень компактными размерами карты (что как раз подчеркивает его название), но энергопотребление у него было жестко ограничено, так что частоты также были сильно ниже, чем у остальных карт линейки Fury.

Схема питания использует 10 фаз для GPU и 2 фазы для памяти. При этом на плате есть посадочные места для 16 дросселей, конденсаторов и т. д., то есть теоретически можно организовать 16 полноценных фаз. Используются весьма дорогие транзисторные сборки DrMOS со встроенным драйвером.

Карта имеет два 8-контактных разъема питания, поэтому в целом система питания рассчитана на энергопотребление до 375 Вт. Стоит отметить, что с карты убраны световые индикаторы мониторинга состояния, которые имеются около разъемов питания у RX Vega. Также нет и двойного BIOS.

Память

Карта имеет 16 ГБ памяти HBM2, размещенной в 4 модулях по 32 Гбит в единой упаковке с GPU. Модули памяти Samsung (HBM2) рассчитаны на номинальную частоту работы в 1000 (2000) МГц.

Охлаждение и нагрев

Главной частью кулера является испарительная камера, оборотная часть которой припаяна к массивному радиатору (имеющему также тепловые трубки для улучшения рассеивания тепла). Поверх установлен кожух с тремя вентиляторами, работающими на одинаковой частоте вращения. Силовые транзисторы охлаждаются тем же радиатором через специальный термоинтерфейс. С оборотной стороны карта прикрывается специальной пластиной, которая играет скорее декоративную роль. В целом виден единый стиль: все покрыто алюминиевым сплавом.

Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder):

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 79 градусов, что является удовлетворительным результатом для видеокарты такого уровня. Следует обратить внимание на второе значение температуры (оно обозначено как «ГП 2», в терминах AMD это Junction Temperature). Это сводное значение, полученное от дополнительных датчиков, разбросанных по всему кристаллу. Именно это значение является ключевым сигналом для драйверов: в случае превышения температуры 100 градусов процессор переводится в режим тротлинга, при достижении этого порогового значения драйвер уже будет пытаться понижать частоты работы. Надо сказать, что такая картина встречалась нам весьма часто, то есть СО все же нуждается в улучшении.

Максимальный нагрев — центральная часть карты в области GPU.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

  • Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
  • Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
  • Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума выполняется по методике, описанной здесь:

  • 28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
  • от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
  • от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
  • 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.

В режиме простоя в 2D температура составляла 30 °C, вентиляторы работали на частоте вращения 800 оборотов в минуту. Шум был равен 21,7 дБА (практически бесшумно).

При просмотре фильма с аппаратным декодированием ничего не менялось: температура ядра оставалась прежней, вентиляторы работали на тех же оборотах, шум сохранялся на уровне 21,7 дБА.

В режиме максимальной нагрузки в 3D температура достигала 79 °C. Вентиляторы при этом раскручивались до 2922 оборотов в минуту, шум вырастал до 46,0 дБА, так

Полный текст статьи читайте на iXBT