Предварительный обзор видеоускорителей AMD Radeon RX 5700 и 5700 XT: разбираем новую архитектуру Navi, смотрим на видеокарты

Справочные материалы:

Теоретическая часть: особенности архитектуры

Ещё в июне, во время игровой выставки E3, компания AMD сделала несколько анонсов, включающих центральные процессоры Ryzen на базе новой архитектуры Zen 2, а также новое семейство видеокарт Radeon RX 5700 также на основе новой архитектуры — RDNA. Перед этим компания показывала эти продукты ещё раньше на Computex, но полноценный запуск был назначен на 7 июля (07.07) — дату, перекликающуюся с 7 нм техпроцессом, применяемым при производстве всех новинок компании. Таким образом, выход новых видеокарт растянулся на несколько недель, и вот наконец-то настал тот день, когда мы можем рассказать вам о них.

Пусть на рынке дискретных GPU для ПК компания AMD не является лидером, но если брать распространение продукции этой компании в целом, то их графические решения применяются не только в значительной части ПК и ноутбуков, но и в игровых консолях (вообще всех основных, включая консоли грядущего поколения, которые будут основаны на улучшенных Zen 2 и Navi), облачных сервисах (Google Stadia) и мобильных решениях (соглашение с Samsung). Общее количество продуктов AMD, используемое по всему миру, составляет более 400 миллионов штук.

Компания собирается закрепить свой успех выпуском настольных CPU и GPU, созданных с применением самого совершенного на сегодня технологического процесса 7 нм, позволяющего поместить больше транзисторов в чип той же площади, увеличить рабочие частоты и повысить энергоэффективность. Но это не единственная их особенность, в новых продуктах компании AMD используются улучшенные архитектуры Zen 2 и RDNA, а в процессорах применён новаторский чиплетный дизайн, позволяющий вместо одного крупного кристалла сделать чип на основе нескольких более мелких, соединив их высокопроизводительными шинами передачи данных и снабдив большим объёмом кэш-памяти. Пока что чиплетный дизайн касается только CPU, но в будущем возможно его применение и для графических процессоров, и уж точно он подойдёт для гибридных решений, сочетающих CPU и GPU.

Но мы сегодня говорим о новейших графических решениях AMD, основанных на графическом чипе Navi 10: Radeon RX 5700 и 5700 XT. Новая серия включает пару видеокарт, предназначенных для верхнего-среднего ценового диапазона, которые заменяют модели RX Vega 64 и Vega 56 в линейке компании, предлагая схожую производительность и лучшую энергоэффективность за меньшие деньги. Пока что в новой линейке не представлены топовые модели — вероятно, что-то более мощное появится значительно позже, а пока что было решено сконцентрироваться на самой большой части рынка энтузиастов.

Новые видеокарты компании AMD стали первыми решениями, основанными на новой архитектуре RDNA (Radeon DNA), которая хоть и связана с GCN, но претерпела довольно значительные изменения. Основной целью при создании новой архитектуры было увеличение эффективности использования имеющихся вычислительных блоков, а также повышение энергоэффективности, по сравнению с GCN. Также очень важна и возможность масштабирования от мобильных решений (недавно было заявлено о сотрудничестве с компанией Samsung о применении RDNA в их будущих продуктах) до серверов и суперкомпьютеров, ведь эта архитектура станет основой для будущих решений компании, предназначенных для разных рынков.

Долгожданный графический процессор Navi вышел на рынок несколько позже, чем его ожидали пользователи, и со времени начала разговоров о полностью новом GPU на 7 нм от компании AMD прошло уже очень много времени. Почему новинки должны быть особенно интересны именно сейчас? Как обычно в таких случаях, производитель говорит об актуальности апгрейда. Ведь порядка 70% игроков до сих пор используют устаревшие видеокарты трёхлетней давности и даже старше, а наиболее популярные GPU предназначены для Full HD-разрешения.

В то же время, современные игры становятся всё более требовательными, и для достижения 60 FPS и выше в них приходится снижать настройки графики даже на таких мощных видеокартах, как Radeon RX Vega 56, которую и заменяет младшее решение новой линейки. А многие пользователи переходят с Full HD-разрешения к более продвинутому 2560×1440. Соответственно, по мнению специалистов компании AMD, сейчас — самое время для апгрейда на видеокарты из новой линейки Radeon RX 5700, которая предназначена для тех, кто планирует использовать монитор с разрешением в 2560×1440 пикселей. И сегодня мы узнаем, насколько это соответствует их запросам.

Хотя основой рассматриваемых сегодня моделей видеокарт серии Radeon RX 5700 стал новый графический процессор Navi 10, основанный на новой архитектуре RDNA, но она тесно связана с GCN последних поколений. Поэтому перед прочтением статьи будет полезно ознакомиться и с нашими предыдущими материалами по видеокартам компании AMD:

Графические ускорители серии Radeon RX 5700
Кодовое имя чипа Navi 10
Технология производства 7 нм
Количество транзисторов 10,3 млрд
Площадь ядра 251 мм²
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_1
Шина памяти 256-битная шина памяти с поддержкой стандарта GDDR6
Частота процессора (базовая/игровая/пиковая) 1605/1755/1905 МГц
Вычислительные блоки 40 вычислительных блоков CU, состоящих в целом из 2560 ALU для целочисленных расчетов и расчетов с плавающей запятой (поддерживаются форматы INT4, INT8, INT16, FP16, FP32 и FP64)
Блоки текстурирования 160 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 64 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра.
Поддержка мониторов поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.4
Спецификации референсной видеокарты Radeon RX 5700 XT
Частота ядра (базовая/игровая/пиковая) 1605/1755/1905 МГц
Количество универсальных процессоров 2560
Количество текстурных блоков 160
Количество блоков блендинга 64
Эффективная частота памяти 14 ГГц
Тип памяти GDDR6
Шина памяти 256-бит
Объем памяти 8 ГБ
Пропускная способность памяти 448 ГБ/с
Вычислительная производительность (FP16) до 19,5 терафлопс
Вычислительная производительность (FP32) до 9,7 терафлопс
Теоретическая максимальная скорость закраски 122 гигапикселя/с
Теоретическая скорость выборки текстур 305 гигатекселей/с
Шина PCI Express 4.0
Разъемы один HDMI и три DisplayPort
Энергопотребление до 225 Вт
Дополнительное питание 8-контактный и 6-контактный разъемы
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $399 (29499 руб)
Спецификации референсной видеокарты Radeon RX 5700
Частота ядра (базовая/игровая/пиковая) 1465/1625/1725 МГц
Количество универсальных процессоров 2304
Количество текстурных блоков 144
Количество блоков блендинга 64
Эффективная частота памяти 14 ГГц
Тип памяти GDDR6
Шина памяти 256-бит
Объем памяти 8 ГБ
Пропускная способность памяти 448 ГБ/с
Вычислительная производительность (FP16) до 15,9 терафлопс
Вычислительная производительность (FP32) до 7,9 терафлопс
Теоретическая максимальная скорость закраски 110 гигапикселей/с
Теоретическая скорость выборки текстур 248 гигатекселей/с
Шина PCI Express 4.0
Разъемы один HDMI и три DisplayPort
Энергопотребление до 180 Вт
Дополнительное питание 8-контактный и 6-контактный разъемы
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $349 (25499 руб)

В очередной раз изменилась система наименований видеокарт AMD. Вместо трёх цифрах в RX 6xx они решили перейти к четырём цифрам и старому доброму суффиксу XT. При этом, и начальные буквы RX из наименования не исчезли. AMD запустила в продажу две модели новой серии: Radeon RX 5700 XT — на полноценной версии GPU, и немного урезанную по скорости Radeon RX 5700. Старшая модель RX 5700 XT имеет 40 вычислительных блоков CU и работает на частоте до 1.9 ГГц, а в младшей RX 5700 деактивированы четыре CU (10%) и GPU работает на более скромной частоте — заодно таким образом будут продаваться те чипы, которые не могут работать в полноценной конфигурации.

Видеокарты серии Radeon 5700 стали долгожданным дополнением линейки компании AMD, они заменяют все виды линейки Vega, будучи быстрее и эффективнее. Что касается цены, то изначально на RX 5700 XT выставили цену в $449, а на младшую 5700 — $379, так как конкурентами новинок, по мнению AMD, являются видеокарты GeForce RTX 2070 и RTX 2060, соответственно. Но NVIDIA буквально на днях нанесла превентивный удар, выпустив обновленную и ускоренную линейку Super, поэтому AMD пришлось чуть-чуть урезать свои аппетиты, и цены на новинки стали уже $399 и $349, соответственно.

И если изначально AMD предполагала, что 5700 XT за $449 будет конкурировать с RTX 2070 за $499, то после выхода улучшенной линейки Super от NVIDIA и снижения цен на «обычные» RTX, им пришлось несколько понизить свои цены и ожидания, так как Super примерно на 10–15% быстрее старых вариантов. С учётом того, что новинки по тестам AMD были чуть быстрее обычных вариантов RTX, то это снижение цен совершенно логично.

Платы Radeon RX 5700 XT и Radeon RX 5700 в референсном дизайне предлагают один разъём HDMI 2.0b и по три разъёма DisplayPort 1.4 HDR c поддержкой технологии Display Stream Compression, позволяющей по одному кабелю подключать поддерживающие технологию HDR-мониторы с разрешением 4K и частотой развёртки 144 Гц (или 8K HDR 60 Гц или 4K при 240 Гц).

Неудивительно, что для решений этого ценового диапазона в AMD решили отказаться от хорошей, но весьма дорогой HBM2-памяти. Тем более, что получила широкое распространение быстрая GDDR6-память, ставшая логичным выбором для нового GPU. Да и объём видеопамяти в 8 ГБ кажется единственно правильным вариантом для этого ценового диапазона. 4 ГБ — уже слишком мало, а 16 ГБ — перебор, не имеющий никакого смысла для игровых решений.

Если говорить об энергопотреблении GPU, то потребление всей платой RX 5700 XT составляет 225 Вт, что аналогично Radeon RX 590 и близко к Vega 56. Для доставки необходимого питания, кроме слота PCI Express используются два дополнительных разъёма питания: 8- и 6-контактный, позволяющие обеспечить подачу 225 Вт. Это довольно много для решения среднего уровня, тем более — с GPU, произведённым по самому совершенному на сегодня техпроцессу. Интересно будет узнать, сколько новинки потребляют в реальности и как с этим справляется система охлаждения.

В отличие от обычной Radeon RX 5700, которая похожа скорее на Radeon VII, дизайн корпуса старшей модели XT был переделан, он имеет явную «вмятину» на одной из граней, которая смотрится довольно забавно. В остальном, это кулер того же стиля, что и во всех предыдущих продуктах компании на протяжении многих лет — с испарительной камерой, отводящей тепло от GPU к радиатору. Конечно, кулер оптимизирован по сравнению с его предшественниками, для достижения лучшего охлаждения и меньшего шума. Всё равно в нестандартных видеокартах от партнёров компании будут применяться другие, совершенно разные решения.

Понятно, что при меньшем количестве активных исполнительных блоков, работающих на сниженной частоте (а наверняка ещё и напряжении) в случае младшей Radeon RX 5700, ниже становится и потребление энергии. Действительно, младшая карта вместо 225 Вт потребляет уже всего 180 Вт, что сравнимо с потреблением RX 580, так что из пары новых GPU именно младшая должна стать более энергоэффективной, как это часто и бывает. К слову, обе видеокарты в референсном дизайне имеют 7-фазную систему питания, что должно обеспечить неплохие возможности по разгону.

Референсные карты с кулером от AMD должны уже с сегодняшнего дня появиться в продаже, а вот видеокарты собственного дизайна от производителей появятся в магазинах несколько позже, но примерно по этим же ценам. Впрочем, скорее всего, как минимум поначалу розничные цены всё равно будут значительно выше рекомендованных, как это обычно бывает с новинками.

Чтобы улучшить привлекательность новых решений для покупателей, AMD приготовила комплект с трёхмесячной подпиской на сервис Xbox Game Pass от Microsoft. Приобретающие видеокарты серии Radeon RX 5700 серии, процессоры Ryzen 3000 и другие продукты AMD у участвующих в акции продавцов, получат трёхмесячный доступ к сервису Xbox Game Pass для ПК. В частности, игроки смогут опробовать боевик Gears 5 уже 10 сентября 2019 года, равно как и другие 100 игр, которые будут доступны им для скачивания без ограничений с августа 2019 года.

Также отметим, что ограниченным тиражом было выпущено и специальное юбилейное издание Radeon RX 5700 XT — в честь 50-летия компании. Эта модель получила увеличенные тактовые частоты и некоторые детали золотого цвета, а также автограф руководителя AMD — Лизы Су. Такая модель видеокарты предназначена для фанатов компании, она обойдётся ещё чуть дороже и найти её будет сложнее.

Архитектурные особенности

Графический процессор Navi 10 основан на совершенно новой архитектуре RDNA  которая была спроектирована для оптимального распределения загрузки исполнительных блоков графическими и вычислительными задачами, которых становится всё больше в играх. Также была серьёзно переработана система кэширования, снижены задержки, повышена пропускная способность и энергоэффективность многоуровневого кэша.

Хотя архитектура действительно новая, но базовые блоки в ней — это всё те же вычислительные блоки Compute Unit (CU), из которых собраны все современные графические процессоры AMD. Каждый CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память и полноценный текстурный конвейер с блоками выборки и фильтрации. Каждый из таких блоков самостоятельно занимается планированием и распределением работы. Рассмотрим схему полноценной версии чипа:

Как видите, архитектура RDNA хоть и действительно была серьёзно переделана, но она унаследовала и некоторые элементы GCN. Полная версия Navi 10 содержит 40 вычислительных блоков нового дизайна, которые состоят из 2560 блоков ALU, 160 блоков TMU, 64 блоков ROP и четырёх асинхронных вычислительных движков. Также новый GPU содержит процессор обработки геометрии с четырьмя блоками обработки примитивов.

Сразу видно, что в Navi исправили одну из слабостей предыдущих графических процессоров компании — относительное малое количество блоков растеризации, что вызывало в результате низкую скорость обработки геометрии и относительно большой урон производительности при включении мультисэмплинга. Теперь блоков ROP стало больше по отношению к ALU, и такие вещи, как заполнение геометрического буфера, карты теней и другие проходы растеризации будут осуществляться заметно быстрее.

Также претерпел довольно большие изменения и общий дизайн вычислительных блоков, хотя в общих чертах он и схож с тем, что было в GCN. По сравнению с предыдущими GPU, в Navi было удвоено количество скалярных блоков и блоков управления, скалярные инструкции могут исполняться каждый цикл, а не раз в четыре. Появился выделенный скалярный блок и выделенный блок выдачи инструкций, улучшена предвыборка.

Но главное — новые CU имеют два режима исполнения: Wave32 и Wave64, адаптированные для разных типов загрузок, а ширина блока SIMD была увеличена с 16 слотов (SIMD16) до 32 (SIMD32), так что размер вейвфронта теперь соответствует размеру SIMD. Это ключевое архитектурное изменение RDNA позволяет более эффективно загружать работой имеющиеся блоки SIMD. Если в GCN один Wave64 выполняется за четыре такта на SIMD16, то в случае RDNA один Wave32 исполняется за один же такт на одном SIMD32. А исполнение 64 потоков группируется как пара Wave32 и они исполняются на двух SIMD32. Два вычислительных блока Compute Unit могут работать как единый процессор (workgroup processor), это даёт доступ к удвоенному количеству ALU и удвоенному регистровому файлу, а также до четырёх раз увеличенной ПСП для кэша.

В AMD как бы разделили CU, перейдя на вейвфронты по 32 потоков. Такая организация помогает выполнять задачи эффективнее при незаполненном вейвфронте. Широкий вейвфронт в 64 потока хорош для параллельных неграфических вычислений, а для графики вейвфронт из 32 тредов упрощает задачу использования имеющихся ресурсов при шейдинге разных материалов. На чипах архитектуры GCN любой вейвфронт выполняется за четыре такта, а на RDNA за один такт при 32 элементах на одном SIMD или 64 элементов также за один такт, но уже на паре SIMD. Также в CU стало вдвое больше скалярных блоков и шедулеров. Всё сделало RDNA несколько ближе к тому, что есть у NVIDIA, и игровым программистам теперь будет проще оптимизировать под AMD и NVIDIA одновременно. С другой стороны, довольно большое количество существующих оптимизаций под GCN и его асинхронные вычисления могут перестать работать с той же эффективностью.

В RDNA появилась возможность параллельного запуска и обработки нескольких независимых инструкций за один такт, что даёт некоторый прирост по эффективности исполнения, хотя и не слишком большой. У конкурента ещё в старых GPU можно было параллельно выполнять и математические инструкции и операции по сохранению и загрузке (load/store), но затем оставили только параллельное исполнение математики и load/store. В последних же поколениях, начиная с Volta, куда большая эффективность достигается удвоением темпа исполнения инструкций и независимыми блоками для обработки целочисленных данных и данных с плавающей запятой, а также load/store блоками. У AMD такого (пока что) нет.

Так как вычислительные блоки СU в Navi довольно сильно переработаны, то к качеству оптимизации драйверов и компилятора шейдеров предъявляются повышенные требования. Вполне возможно, что привычные простые порты с консольных GCN уже не будут оптимально подходить для новой архитектуры RDNA, и программистам AMD пришлось переделывать компилятор, и они ещё будут оптимизировать его для новой архитектуры какое-то время.

Хотя разница между GCN и RDNA есть, но архитектуры явно родственные. Преимущества в новом распределении и исполнении инструкций привели к увеличению загрузки имеющихся в GPU блоков — если в GCN часть ALU простаивали, то в RDNA часть задержек маскируется возможностью многопоточного исполнения. RDNA получается несколько ближе к решениям NVIDIA по универсальности, но для неё придётся иначе оптимизировать код, а не как для GCN, и раскрытие возможностей может быть постепенным.

Кроме того, что был повышен темп исполнения инструкций вычислительными процессорами, также увеличили и эффективность кэширования. Была изменена иерархия уровней кэш-памяти, добавлена кэш-память первого уровня общим объёмом в 512 КБ, удвоена пропускная способность между вычислительными блоками и L0-кэшем, а объём L2-кэша стал больше — 4 МБ на чип (как у конкурирующей GeForce RTX 2060).

Уменьшение задержек кэш-памяти на каждом уровне составило более чем 20%, а задержка доступа к данным из видеопамяти была снижена на 7–8%, что тоже очень полезно. И это ещё не говоря о повышении пропускной способности на всех уровнях подсистемы памяти. Кроме этого, на многих линиях передачи данных внутри чипа (между кэшами L1 и L2 и памятью в том числе) используется сжатие данных без потерь, помогающее экономить ПСП и энергию.

Все архитектурные улучшения RDNA по сравнению с GCN привели к тому, что эффективность (общая производительность GPU при равной тактовой частоте) выросла на четверть, а энергоэффективность — на все 50%. При этом, далеко не всё преимущество было достигнуто при помощи 7 нм техпроцесса, его вклад составил лишь около 25%-30%, а остальной прирост был достигнут за счёт архитектурных улучшений в RDNA и модернизированной системы питания.

Если сравнивать графические процессоры семейства Navi с Vega, то новинка быстрее Vega 56 на 25–40%, а абсолютный прирост производительности над Vega 64 составляет 14%, и это при меньшем на 23% уровне потребления энергии. И если перейти к сравнению площадей этих GPU, то новое решение более чем вдвое меньше по размеру (251 мм2 против 495 мм2) за счёт применения 7 нм техпроцесса против 14 нм, что позволяет не только повысить производительность нового GPU, но и снизить себестоимость продукции.

А вот с точки зрения поддержки новых графических возможностей в RDNA не так много нового. Эти GPU поддерживают всё те возможности Direct3D12, что и GCN, включая Rapid Packed Math (FP16) — вдвое ускоренные вычисления со сниженной точностью. Увы, но Navi не поддерживает какого-либо аппаратного ускорения трассировки лучей, как не было объявлено и о поддержке переменной частоты закраски (variable rate shading). И о шейдере примитивов (primitive shader), о котором много рассказывали во время анонса Vega, сейчас уже молчат. Вероятно, того их вида, который поддерживается в Vega, недостаточно для полной поддержки mesh shaders в DirectX API, и все их функции реализовать пока не получилось.

Поддержка высокопроизводительной шины PCI Express 4.0

Компания AMD стала первой в индустрии, кто реализовал и выпустил в продажу сразу несколько продуктов с поддержкой PCI Express новой версии 4.0. И видеокарты Radeon RX 5700 и процессоры Ryzen 3000 и чипсет X570 — всё готово к передаче действительно больших объёмов данных на высокой скорости — вдвое выше, чем у привычной версии 3.0. Да, уже была анонсирована и ещё более производительная версия PCI Express 5.0, но когда там она ещё появится в готовых продуктах…

В случае установки видеокарт новой серии в системную плату на базе чипсета AMD X570, у вас получится решение с полной поддержкой PCIe 4.0 — единственное имеющееся на рынке. Создатели общепринятого индустриального бенчмарка 3DMark уже создали специальный тест для измерения производительности шины PCI Express, который показывает серьёзное превосходство новой версии шины над предыдущей.

Конечно, это всего лишь тест, а в играх и обычных приложениях разницы вы не увидите ещё долго, но в некоторых профессиональных задачах, вроде проигрывания видеороликов разрешения 8K формата ProRes4×4 в специализированном ПО DaVinci Resolve 16, с использованием PCI Express 4.0 по данным AMD получается 60 FPS вместо 36 FPS в случае PCIe 3.0. Возможно, этот пример слегка притянут за уши, но наверняка же кто-то уже занимается обработкой таких роликов, они точно оценят.

Улучшенные движки по выводу изображения и обработке видеоданных

Некоторые изменения произошли и в блоках обработки видео и вывода изображения на дисплеи. Увы, поддержки HDMI 2.1 в Navi нет, и контроллер схож с тем, что мы видели в Vega, он поддерживает HDMI 2.0b и DisplayPort 1.4 HDR (с FreeSync 2, конечно же). Единственное дополнение тут — поддержка потокового сжатия DisplayPort 1.4 Display Stream Compression (DSC), Display Stream Compression 1.2a, позволяющее одним кабелем подключать 4K-мониторы с частотой обновления до 240 Гц или 4K HDR с 120 Гц или 8K-мониторы при 60 Гц.

Сжатие Display Stream Compression позволяет снизить требования к пропускной способности кабеля для вывода высоких разрешений при высокой частоте обновления данных. Это нужно для поддержки 4K-мониторов с частотой обновления в 144 Гц и выше, ведь возможностей стандартного DP 1.4 не хватает для вывода картинки в такой конфигурации. Также возможно подключение шлемов виртуальной реальности по единственному разъёму, если это реализуют партнёры компании.

Движок обработки видеоданных в Navi обеспечивает улучшенное кодирование в HEVC (H.265) формат при разрешении до 8K с ускорением времени кодирования до 40%, по сравнению с предыдущими GPU компании. Кодирование видеоданных в 4K осуществляется при частоте кадров 60 FPS, а декодирование — до 90 FPS (или 24 FPS для 8K-разрешения). Для H.264 декодирование осуществляется в 4K до 150 FPS, а кодирование — до 90 FPS. Видеопоток Full HD-разрешения кодируется и декодируется в оба формата на частоте кадров до 360 FPS. Поток в формате VP9, популярном в Youtube и Twitch, также аппаратно декодируется в разрешении до 4K при 60 FPS.

Новые программные технологии

Помимо аппаратной части всегда важна и программная поддержка — и в новой версии драйверов Adrenalin 2019 Edition, кроме уже известных нам ранее технологий AMD Link, Radeon Relive, Radeon Chill, появились и новые. К примеру, это Radeon Anti Lag — возможность, значительно (на 30% и даже больше) снижающая задержки между действиями игрока и их отображением на экране. Это особенно важно для киберспортивных применений:

По данным AMD, с включением Radeon Anti Lag, в подобных играх время между действием и отображением на экране становится на треть меньше. Вместо 45–55 мс в некоторых играх получается 30–37 мс, что будет заметно игрокам высокого уровня. Особых технических деталей реализации в AMD не раскрывают, но по описанию работы похоже, что всё делается программно в драйвере — он слегка притормаживает очередь кадров на CPU и приводит возможности CPU и GPU к единому целому, что и улучшает отзывчивость.

Эта возможность лучше работает, когда производительность ограничена мощностью GPU, если графический процессор достаточно медленный, а CPU — быстрый. В обратных случаях, с упором скорости в CPU, никакой разницы не будет. Кстати, эта новая возможность работает не только на новых видеокартах серии Radeon 5700, но и на всех решениях на основе GCN, в играх, использующих DirectX 9 и DirectX 11.

Также была объявлена поддержка адаптивного увеличения резкости Radeon Image Sharpening. По сути, это встроенный в драйвер несложный постфильтр для повышения резкости изображения с минимальным влиянием на производительность (до пары процентов). Его полезность особенно хорошо проявляется в тех играх, которые используют алгоритмы полноэкранного сглаживания, сильно замыливающие изображение (FXAA, TAA и другие).

Кроме этого, Radeon Image Sharpening (RIS) умеет также качественно повышать разрешение из низкого в рабочее разрешение монитора. На данный момент возможность открыта только для видеокарт на основе графических процессоров Navi для игр, использующих Vulkan, DirectX 9 и DirectX 12. Зато технология поддерживается большим количеством игр и не требует никаких изменений в их коде.

Собственно, это некий аналог одного из фильтров известного инструмента Reshade, только сразу в драйверах. У конкурирующей компании NVIDIA также есть свой Freestyle, встроенный в GeForce Experience, служащий для аналогичных целей — дополнительная постобработка картинки: изменение яркости, цветности, резкости и т.д.

Подобное адаптивное увеличение резкости (Contrast Adaptive Sharpening) входит и в комплект AMD FidelityFX, который предлагается разработчикам для встраивания в игры. Кроме повышения резкости, а также качественного фильтра масштабирования, позволяющего повысить резкость при выводе изображения, отрисованного в меньшем разрешении в большее, в будущем также предполагается добавление в пакет и других постфильтров.

Повышение резкости работает неплохо, и лучше всего подходит для игр с сглаживанием типа TAA, которое сильно замыливает картинку, используя данные из предыдущих кадров. Для AMD важно, что работа CAS дополнительно ускоряется на видеокартах Vega и Navi при помощи Rapid Packed Math — удвоенного темпа исполнения инструкций с FP16-точностью. AMD FidelityFX уже поддержан разработчиками Saber, Codemasters, Ubisoft, Capcom, Unity, Rebellion, Gearbox, Croteam и другими — для интеграции в их будущие игры.

Единственное, что стоит пояснить отдельно — не нужно сравнивать RIS/CAS с DLSS, ведь довольно простой постфильтр от AMD не умеет дорисовывать детали при помощи алгоритмов искусственного интеллекта, как это делает NVIDIA DLSS (пусть и неидеально, но это уже отдельный вопрос). В этом и заключается принципиальная разница между ними. Возможно, AMD со временем сделает также и аналог DLSS на DirectML для FidelityFX, к примеру, но пока что мы видели только постфильтр для повышения резкости.

Предварительная оценка производительности

Прежде чем делать какие-то выводы о реальной производительности Radeon RX 5700 (XT), пусть и по собственным тестам AMD, сравним характеристики нескольких моделей видеокарт компании, включив в таблицу Vega 64, которую заменяет старшая из представленных моделей, а также самую мощную видеокарту семейства Polaris:

  Radeon RX 5700 XT Radeon RX Vega 64 AMD Radeon RX 590
Техпроцесс TSMC, 7 нм GloFo, 14 нм GloFo, 12 нм
Кодовое наименование GPU Navi 10 Vega 10 Polaris 30
Архитектура RDNA GCN 5 GCN 4
Количество транзисторов, млрд 10,3 12,5 5,7
Площадь кристалла, мм² 251 495 232
Количество блоков ALU 2560 4096 2304
Количество блоков TMU 160 256 144
Количество блоков ROP 64 64 32
Базовая частота, МГц 1605 1247 1469
Турбо частота, МГц 1905 1546 1545
Частота видеопамяти, МГц 14000 1890 8000
Ширина шины видеопамяти, бит 256 2048 256
Объем видеопамяти, ГБ 8 8 8
Производительность FP32, TFLOPS 9,8 12,7 7,1
Энергопотребление, Вт 225 295 225
Рекомендованная цена, $ 399 499 279

Хотя Navi заменяет Vega на рынке, по своей сути это скорее аналог Polaris — GPU среднего уровня, а не топовый чип. Новый графический процессор имеет площадь 251 мм2 и содержит 10,3 миллиарда транзисторов. То есть, чип Navi 10 получился лишь чуть больше Polaris 10, имеющего площадь в 232 мм2, но при этом вмещает чуть ли не вдвое больше транзисторов, благодаря 7 нм техпроцессу. Надеемся, что все их потратили на прирост производительности.

Так как архитектура RDNA оптимизирована для увеличения эффективности, то напрямую спецификации сравнивать нужно с осторожностью — наверняка Radeon RX 5700 (XT) даже при схожем количестве исполнительных блоков и на одной частоте должен быть производительнее своих предшественников из семейства Polaris. По крайней мере в теории, на практике могут возникнуть вопросы в случае ПО, хорошо оптимизированного именно под особенности GCN, вроде активного использования асинхронных вычислений, от которых на RDNA может наблюдаться меньший прирост (в теории).

Пара слов по поводу тактовых частот новых GPU. AMD говорит, что старший чип работает на частоте до 1905 МГц, но это так называемая «турбо-частота» (boost), максимальная для чипа вообще. Работает же GPU чаще на несколько меньшей — появившейся в Navi «игровой частоте» (game), что является аналогом турбо-частоты для видеокарт NVIDIA. Это — типичная тактовая частота, средняя достигаемая в процессе игры. Сам по себе подход по тактовым частотам остался неизменным, она повышается до того, как ограничивается пределами по питанию и температуре. И в играх, вполне вероятно, будет наблюдаться изменение тактовой частоты GPU от «игровой» до «турбо», и даже выше — как и у NVIDIA (хотя названия для этих частот у компаний разные).

Всё это не влияет ни на что, кроме пиковых показателей — компании AMD и NVIDIA отличаются разным подходом и указывают цифры при разных частотах. Для Radeon RX 5700 XT максимальная производительность достигает 9,75 терафлопс для FP32-точности, что хоть и значительно выше, чем у Polaris, но не совсем соответствует увеличившейся сложности GPU. То есть, пиковые теоретические показатели относительно сложности чипа у GCN выше, но в том и дело, что на практике они практически недостижимы. А RDNA намеренно была изменена так, чтобы при меньшей теоретической производительности было легче достичь более высокой реальной скорости. Всё это нужно учитывать в своих прикидках.

Графический процессор Navi 10 имеет 64 блока ROP, что вдвое больше, чем у Polaris, хоть и столько же, что и у Vega, но соотношение ROP к ALU у нового GPU выше. Для того, чтобы прокормить новый чип данными, Navi 10 поддерживает видеопамять типа GDDR6, обеспечивающую гораздо более высокую пропускную способность, по сравнению с GDDR5 (448 ГБ/с против 256 ГБ/с у Polaris). Кроме этого, было переработано сжатие данных, а вместе с ним выросла и эффективная пропускная способность памяти, в чём решения AMD ранее уступали конкурентам. В целом, с 64 более эффективными блоками ROP и серьёзно повышенной ПСП, семейство RX 5700 выглядит более сбалансированным, по сравнению с Polaris.

Младшая модель Radeon RX 5700 имеет несколько меньшую производительность, энергопотребление и цену. Из 40 блоков CU в младшей модели активными остались 36 штук, а тактовая частота снижена до 1625 МГц игровой и 1725 МГц турбо-частоты. То есть, чисто теоретически, младшая модель должна обеспечивать около 87% скорости старшей. Исключая производительность блоков ROP и обработки геометрии, которые будут лишь на 7% медленнее, чем у старшей модели. А 

Полный текст статьи читайте на iXBT