Видеоускоритель AMD Radeon RX 7900 XTX (24 ГБ): теория, архитектура, описание карты Sapphire, синтетические, игровые тесты (включая тесты с трассировкой лучей), выводы

Общие сведения

Настало время рассмотреть новую топовую видеокарту AMD — флагмана линейки. С семейством Radeon RX 7900 у нас всё получилось не так, как обычно: первой на обзор попала младшая из пары вышедших моделей — Radeon RX 7900 XT, и именно в той статье мы максимально подробно рассказали об архитектурных изменениях RDNA3, как и о многом другом. Но верхняя модель линейки интересна уже хотя бы тем, что показывает максимум на момент выхода, а в случае Radeon RX 7900, старшая XTX еще и получилась чуть выгоднее, если смотреть на разницу по производительности и рекомендованным ценам.

Новые модели видеокарт основаны на третьем поколении графической архитектуры — RDNA3, а графический процессор Navi 31 стал первым GPU, имеющим чиплетную конфигурацию из нескольких кристаллов на одной подложке, аналогично процессорам Ryzen. Чиплеты должны помочь в достижении лучшей производительности при сохранении невысокой сложности при меньшей себестоимости по сравнению с монолитным кристаллом. Кэш-память Infinity Cache и контроллеры GDDR6-памяти были перенесены на шесть маленьких кристаллов, которые производятся при помощи техпроцесса 6 нм, а основная часть GPU использует более совершенный техпроцесс 5 нм.

Архитектура RDNA3 примерно на 50% энергоэффективнее, чем аналогичные по уровню решения RDNA2, также она приносит множество улучшений в вычислительных возможностях, подсистеме памяти и выводе информации на дисплеи, а заодно устраняет недоработки предыдущей архитектуры: в RDNA3 добавились специализированные блоки ускорения искусственного интеллекта, а блоки аппаратной трассировки лучей были серьезно усилены — как раз то, чем была слаба RDNA2.

По данным компании, Radeon RX 7900 XTX обеспечивает до 70% бо́льшую частоту кадров в 4K-разрешении по сравнению с предыдущей топовой моделью RX 6950 XT, и это связано как с архитектурными преимуществами RDNA3, так и с повышенной тактовой частотой и увеличенным количеством исполнительных блоков. Топовая видеокарта основана на полной версии графического процессора Navi 31 и предназначена для требовательных игроков, выбирающих 4K-разрешение и максимальные настройки качества, а главным конкурентом для нее является Nvidia GeForce RTX 4080, имеющая на 20% бо́льшую рекомендованную цену.

Основой рассматриваемой сегодня модели видеокарты является новый графический процессор Navi 31, базирующийся на архитектуре RDNA третьего поколения, которая тесно связана с архитектурами RDNA предыдущих версий, так что перед прочтением статьи будет полезно ознакомиться с нашими предыдущими материалами по видеокартам компании AMD:

Графические ускорители серии Radeon RX 7900
Кодовое имя чипа Navi 31
Технология производства 5 нм и 6 нм (N5 и N6 TSMC)
Количество транзисторов 57,7 млрд (26,8 млрд у Navi 21)
Площадь ядра 522 мм² (520 мм² у Navi 21)
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти 384-битная: 6 независимых 64-битных контроллера памяти с поддержкой GDDR6
Частота графического процессора до 2500 МГц
Вычислительные блоки 96 вычислительных блоков CU, состоящих в целом из 6144 (или 12288, смотря как считать) ALU для целочисленных расчетов и расчетов с плавающей запятой (поддерживаются форматы INT4, INT8, INT16, FP16, FP32 и FP64)
Блоки трассировки лучей 96 блоков Ray Accelerator для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования 384 блока текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 24 широких блока ROP на 192 пикселя с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов поддержка интерфейсов HDMI 2.1b и DisplayPort 2.1
Спецификации референсной видеокарты Radeon RX 7900 XTX
Частота ядра (игровая/турбо) 2270/2500 МГц
Количество универсальных процессоров 6144 (12288)
Количество текстурных блоков 384
Количество блоков блендинга 192
Эффективная частота памяти 20 ГГц
Тип памяти GDDR6
Шина памяти 384 бит
Объем памяти 24 ГБ
Пропускная способность памяти 960 ГБ/с
Вычислительная производительность (FP32) до 61,4 терафлопс
Теоретическая максимальная скорость закраски 480 гигапикселей/с
Теоретическая скорость выборки текстур 960 гигатекселей/с
Шина PCI Express 4.0×16
Разъемы один HDMI 2.1b, два DisplayPort 2.1 и один USB Type C
Энергопотребление до 355 Вт
Дополнительное питание два 8-контактных разъема
Число слотов, занимаемых в системном корпусе 2,5
Рекомендуемая цена $999

Наименование новой модели видеокарты не совсем соответствует принятому несколько лет назад принципу, ведь по сравнению с менее мощной Radeon RX 7900 XT, у нее поменялся суффикс на XTX — такого в видеокартах Radeon мы не видели уже очень давно, хотя ранее такие варианты и встречались, можно вспомнить Radeon X1900 XTX. В последних же поколениях для более мощной модели обычно изменяли цифровое обозначение, добавляя 50 к наименованию — то есть название RX 7950 XT было бы логичнее. Но оно могло быть оставлено для обновления линейки через полгода-год.

Впрочем, наименование не так уж важно. Просто теперь топовая модель имеет суффикс XTX, и новинка стоит на самом верху линейки (как минимум пока что, до потенциального выхода еще более производительных GPU), на ступень выше уже рассмотренной нами Radeon RX 7900 XT. Про цены мы уже писали — в этом поколении они несколько выше ожидаемых, и частично это объясняется общей ситуацией на мировых рынках. Разница в рекомендованных ценах между XT и XTX составляет лишь $100, и это делает старшую модель даже более привлекательной, исходя из разницы в теоретических характеристик — обычно бывает наоборот.

Если сравнивать цену рассматриваемой сегодня Radeon RX 7900 XTX с решениями конкурента, то тут для нее всё складывается удачно. Главным конкурентом новинки является средняя из трех вышедших старших видеокарт нового семейства — GeForce RTX 4080, имеющая сразу на 20% более высокую рекомендованную цену, хотя она и чуть более производительная в среднем. Но если не брать случаи с трассировкой лучей, то менее дорогая RTX 4070 Ti явно будет везде отставать от RX 7900 XTX, и последнюю всё же правильнее сравнивать с RTX 4080, хотя можно и сразу с обеими.

Исходя из ширины шины видеопамяти, выбор объема для рассматриваемой сегодня видеокарты был между 12 и 24 ГБ. И объема в 12 ГБ прямо сейчас может и хватило бы, но явно не для топового решения, которое нацелено на 4K-разрешение при максимальных настройках с учетом работы на перспективу в несколько лет. Уже сейчас в некоторых играх используется 10–12 ГБ видеопамяти, и выбор 24 ГБ был вполне логичным. И наличие у топовой модели 24 ГБ видеопамяти против 16 ГБ у конкурирующей RTX 4080 хоть и не принесет явного преимущества в играх сразу, но это можно рассматривать как потенциальное преимущество.

Референсный дизайн у моделей Radeon RX 7900 XT и RX 7900 XTX схожий, рассматриваемая сегодня старшая модель чуть больше младшей по всем размерам и имеет RGB-подсветку, в отличие от младшей, которую мы рассматривали в прошлый раз. Даже топовая модель на базе Navi 31 значительно меньше соответствующей ей по цене видеокарты компании Nvidia — RTX 4080, и для кого-то это может быть важным параметром при выборе. Для вывода изображения используются два стандартных разъема DisplayPort 2.1 и один HDMI 2.1, также есть разъем USB-C с поддержкой вывода DisplayPort — для использования с VR-шлемами.

Для дополнительного питания в обеих моделях видеокарт используется по два привычных 8-контактных разъема, что в теории дает до 375 Вт при долговременной нагрузке. И вот тут у Nvidia с их спорным новым 16-контактным разъемом 12VHPWR есть и минусы (в случае плохого контакта разъемы и кабели могут плавиться) и плюсы: по такому разъему можно подать до 600 Вт питания, что важно для мощных топовых видеокарт, вроде RX 7900 XTX.

То есть хотя видеокарты AMD будет проще установить в уже имеющуюся систему, без нового (и довольно редкого пока что) блока питания, всего лишь два 8-контактных разъема на ней ограничивают максимальную мощность, подаваемую на видеокарту: 375 Вт в теории перекрывают заявленные 355 Вт потребления для RX 7900 XTX, но запаса не остается совсем. Неудивительно, что многие варианты видеокарт новой серии, особенно предназначенные для любителей разгона, имеют по три 8-контактных разъема.

Новый дизайн референсных видеокарт нового поколения довольно строг: четкие линии, матовый черный цвет, отсутствие излишних украшательств. Вид у референсных карт простой и элегантный, а для жаждущих более цветастого внешнего вида партнеры AMD выпустили большое количество моделей с собственными дизайном, размерами, подсветкой и системами охлаждения, некоторые из них еще и фабрично разогнаны и имеют повышенные уровни энергопотребления и производительности. Например, таков вариант RX 7900 XTX в исполнении Sapphire, который мы сегодня и рассмотрим. Но сначала вспомним основные особенности архитектуры RDNA3.

Особенности архитектуры

Мы максимально подробно рассмотрели особенности новой архитектуры RDNA3 и первый графический процессор на ее основе в обзоре младшей модели — Radeon RX 7900 XT, и в этом материале лишь вкратце напомним самые основные моменты.

Одним из самых важных отличий Navi 31 является переход на чиплетную компоновку. Основной чиплет содержит вычислительные блоки CU и все основные функциональные блоки, кроме контроллеров памяти и кэш-памяти третьего уровня. Чиплеты с контроллерами памяти и L3-кэшем содержат довольно большие блоки Infinity Cache и физический интерфейс памяти GDDR6, плюс линки Infinity Link для подключения к основному чиплету. Кэш-память и внешние интерфейсы памяти масштабируются плохо, поэтому их стало выгодно перенести на кристалл, производимый по менее продвинутому техпроцессу.

Это помогает снизить себестоимость производства, но есть у чиплетов и недостатки — дополнительные накладные расходы и задержки, связанных с использованием менее производительных линий связей между чиплетами по сравнению с монокристаллами. Впрочем, канал связи между чиплетами довольно быстрый, он имеет общую пропускную способность 5,3 ТБ/с, а между отдельными чиплетами — 900 ГБ/с. А вот занятая на кристаллах площадь и дополнительное энергопотребление этих каналов связи точно является определенным недостатком чиплетной организации — на основном кристалле интерфейсы занимают 10% площади, а дополнительных — около 15%, и эти транзисторы не помогают повысить производительность относительно монокристалла.

Хотя в целом RDNA3 является измененной и доработанной архитектурой со второй версии, в ней произошло немало важных архитектурных изменений. Сначала рассмотрим блок-схему полной версии графического процессора Navi 31, на которой и основана видеокарта Radeon RX 7900 XTX:

Основной чиплет содержит шесть шейдерных движков, каждый из которых состоит из 16 вычислительных блоков (или восьми двойных вычислительных блоков RDNA3), имеющих по 1024 потоковых процессора. То есть всего в чипе содержится 6144 потоковых процессора, 96 ускорителей трассировки лучей и 96 ИИ-ускорителей. Также Navi 31 имеет 384 текстурных блока TMU и аж 192 блоков ROP — вполовину больше, чем Navi 21.

Топовая модель Radeon RX 7900 XTX основана на полной конфигурации графического процессора Navi 31 и включает все 96 CU, поэтому число потоковых процессоров и всех остальных блоков не отличается от написанных выше. В шести дополнительных чиплетах скрывается 96 МБ кэша Infinity Cache, а ширина шины памяти — полноценная 384-битная. Чипы GDDR6-памяти работают на эффективной скорости 20 Гбит/с, что в итоге дает высокую пропускную способность в 960 ГБ/с — почти как у флагманских решений конкурента.

Наиболее заметными изменениями графической архитектуры RDNA3 стали: введение вычислительных блоков с одновременным запуском двух инструкций на исполнение, специальные оптимизации для более полного использования имеющихся ресурсов, поддержка новых математических форматов, а также ускорение ИИ-вычислений при помощи перераспределения ресурсов для исполнения матричных функций и улучшенные блоки аппаратной трассировки лучей. Эти оптимизации дают повышение производительности на такт порядка 17% по сравнению с вычислительными блоками архитектуры RDNA2.

Блоки ИИ-ускорения, появившиеся в архитектуре RDNA3, переназначают SIMD32 модули для выполнения матричных вычислений вместо обычных FP32/FP16-операций. Вместе с FP16 поддерживаются форматы BF16 и INT8, и все три имеют одинаковую пиковую производительность, превышающую вдвое производительность при одинарной точности с плавающей запятой — FP32. Повышение производительности матричных вычислений, которые часто используются в задачах искусственного интеллекта, компания AMD оценивает в 2,7 раз, учитывая все улучшения. Для игровых GPU это важно для потенциального использования ИИ-ускорения в технологии масштабирования FSR 3.0 — теперь аппаратно ускоренные матричные операции есть у GPU всех трех компаний, производящих графические процессоры.

Очень важными стали улучшения в аппаратных блоках трассировки лучей новой архитектуры. Navi 31 получил второе поколение таких блоков, в которые были внедрены специализированные режимы сортировки и сокращения итераций обхода дерева сортировки. В RDNA3 сосредоточились на увеличении эффективности трассировки, в частности улучшенном обходе структур BVH, также имеется в 1,5 раза больший векторный регистровый файл, что позволяет обсчитывать больше лучей одновременно. Применяются и другие оптимизации для снижения количества вычислений при обходе BVH, специализированные алгоритмы сортировки для повышения эффективности и т. д.

Благодаря новым оптимизациям, повышенной тактовой частоте и увеличенному количеству блоков ускорения трассировки лучей, в флагманском чипе RDNA3 обеспечивается повышение производительности при трассировке лучей до 1,8 раза по сравнению с лучшим решением архитектуры RDNA2. По данным самой компании, Radeon RX 7900 XTX обеспечивает в условиях активного использования трассировки лучей значительно более высокую частоту кадров по сравнению с RX 6950 XT из прошлого поколения:

В RDNA3 была серьезно улучшена подсистема кэширования — увеличен объем кэш-памяти всех уровней, увеличен регистровый файл, а также применены более широкие и производительные интерфейсы между блоками. L0-кэш увеличен вдвое, также была увеличена емкость кэшей среднего уровня — L1 также вдвое и L2 в полтора раза — чтобы лучше справляться с повышенной производительностью графического процессора Navi 31. И, несмотря на увеличение пропускной способности, в RDNA3 задержки для L1 и L2 кэшей даже были немного снижены.

А вот L3-кэш, известный как Infinity Cache, в Navi 31 уменьшился до 96 МБ против 128 МБ в лучших GPU прошлого поколения, но при этом связь между L3 и L2 кэшами стала в 2,25 раза шире и пропускная способность повысилась в 2,7 раза. Повышенные задержки L3-кэша неудивительны — Infinity Cache теперь реализован в виде отдельных чиплетных кристаллов, но RDNA3 способна обслуживать большее количество обращений к памяти при помощи более быстрого и объемного L2-кэша, и количество обращений к Infinity Cache в целом должно снизиться.

Что касается пропускной способности видеопамяти, шесть 64-битных каналов дают 384-битную шину GDDR6-памяти, которая работает на скорости 20 Гбит/с — по сравнению с 16 Гбит/с у 6900 XT и 18 Гбит/с у RX 6950 XT. Итоговая пропускная способность в случае модели RX 7900 XTX возросла до 960 ГБ/с, что всего лишь на 5% меньше, чем 1008 ГБ/с у топового решения конкурента — GeForce RTX 4090, не говоря о 717 ГБ/с у прямого соперника — RTX 4080. Это преимущество может стать весьма полезным в современных играх, особенно в 4K-разрешении.

Из других улучшений в RDNA3 можно отметить изменения в блоках обработки видеоданных и вывода информации на дисплеи. Navi 31 способен кодировать и декодировать видеоданные в формате AV1 при помощи пары независимых блоков кодирования-декодирования, которые могут обрабатывать два независимых видеопотока или объединять возможности при работе с одним потоком с удвоенной производительностью — видеодвижки в Navi 31 на 80% быстрее предшественников из RDNA2 и позволяют одновременно работать с парой видеопотоков в форматах H.264 и H.265. Также новый GPU может кодировать и декодировать видеопоток формата AV1 при 8K-разрешении с частотой кадров в 60 FPS — то есть имеет примерно те же возможности, что есть и у конкурентов.

Был улучшен движок поддержки дисплеев — новый Radiance Display Engine поддерживает разъемы DisplayPort 2.1 со скоростями передачи данных UHBR 10 и UHBR 13.5, что вдвое больше, чем у DisplayPort 1.4. Хотя у видеокарт Intel также есть поддержка DisplayPort 2.1, но максимальная пропускная способность для решений Arc ограничена значением 40 Гбит/с (UHBR 10), а для Radeon RX 7900 это уже 54 Гбит/с (UHBR 13.5). Поддержка такой пропускной способности означает возможность подключения 4K-дисплея одним кабелем — с частотой обновления до 240 Гц без использования сжатия видеопотока, а со сжатием Display Stream Compression можно использовать 4K при 480 Гц или 8K при 165 Гц.

Краткий анализ производительности

Рассмотрим характеристики двух выпущенных видеокарт в сравнении с лучшим решением предыдущего поколения, а также всеми тремя моделями видеокарт семейства GeForce RTX 40. Да, с топовой моделью RTX 4090 новинки компании AMD на рынке не соперничают — слишком большой и мощный GPU получился у конкурента, но мы его также вставили в таблицу — чтобы прикинуть, насколько топовая модель AMD отстает от лучшей видеокарты соперника по теоретическим характеристикам.

  Radeon RX 7900 XTX Radeon RX 7900 XT Radeon RX 6950 XT GeForce RTX 4090 GeForce RTX 4080 GeForce RTX 4070 Ti
Модель GPU Navi 31 Navi 31 Navi 21 AD102 AD103 AD104
Техпроцесс, нм 5/6 5/6 7 5 5 5
Кол-во транзисторов, млрд 57,7 55,6* 26,8 76,3 45,9 35,8
Площадь, мм² 522 485* 519 608 379 295
Потоковые процессоры 6144 (12288) 5376 (10752) 5120 16384 9728 7680
Блоки TMU 384 336 320 512 304 240
Блоки ROP 192 192 128 176 112 80
RT-ядра 96 84 80 128 76 60
Турбо-частота, ГГц 2,5 2,4 2,3 2,5 2,5 2,6
Объем видеопамяти, ГБ 24 20 16 24 16 12
Частота видеопамяти, ГГц 20 20 18 21 22,4 21
Ширина шины, бит 384 320 256 384 256 192
L2/L3-кэш, МБ 96+6 80+6 128+4 76 64 48
ПСП, ГБ/с 960 800 576 1008 717 504
Производительность FP32, Тфлопс 61,4 51,6 23,7 82,6 48,7 40,1
Текстурирование, Гтекс/с 960 804 739 1290 762 626
Скорость заполнения, Гпикс/с 480 460 296 444 281 209
Потребление, Вт 355 300 335 450 320 285
Рекомендованная цена, $ 999 899 1099 1599 1199 799
* — с учетом одного отключенного чиплета

По сравнительным характеристикам сразу видно, что GeForce RTX 4090 — решение совсем другого уровня, слишком велика разница вообще по всем параметрам, кроме пропускной способности памяти и скорости заполнения, так как у Radeon RX 7900 XTX широкая шина памяти и довольно большое количество блоков ROP — в том числе благодаря чиплетной конфигурации, которая и позволила разместить больше контроллеров памяти, чем на монолитном кристалле схожей площади. Интересно, будет ли довольствоваться AMD ролью второго номера или подготовит более мощный чип с условным названием Navi 30, имеющий большее количество исполнительных блоков? Можно даже оставить шесть чиплетов кэша-памяти, поменяв лишь основной кристалл на имеющий большее количество блоков — для конкуренции с RTX 4090. Себестоимость при этом не должна вырасти слишком сильно.

По пропускной способности памяти у Nvidia уже больше нет преимущества — из-за широкой шины памяти Navi 31 почти догнал конкурента, даже с GDDR6-памятью против GDDR6X. Повышенная ПСП важна для обеспечения эффективной работы более производительного GPU, это же должно помочь избежать проблем из-за снижения объема кэша Infinity Cache по сравнению с предыдущим поколением. Чиплетная организация позволила ограничить площадь основного кристалла за счет перемещения L3-кэша и контроллеров памяти на отдельные чиплеты — это также помогло и получить более широкую общую шину памяти при использовании основного кристалла меньшей площади, на котором физически не нашлось бы места для 384-битной шины.

С другой стороны, из-за необходимости реализации быстрых каналов связи между чиплетами могла увеличиться общая площадь кристаллов. Сравним ближайших конкурентов по количеству транзисторов и размерам кристаллов. Чип AD103, используемый в RTX 4080, имеет 45,9 млрд транзисторов и площадь в 369 мм², а Navi 31 имеет общую площадь всех чиплетов в 522 мм² и 57,7 млрд транзисторов. Гипотетический монолитный чип с такими параметрами был бы перебором по сложности и себестоимости, да и чиплетная организация вряд отличается немалыми накладными расходами — часть площади и транзисторов расходуются на то, что не влияет на производительность, а только на поддержку связи между кристаллами.

Что касается сравнительной производительности, то по данным AMD модель Radeon RX 7900 XTX должна быть в 1,5–1,7 раза быстрее предшественника — RX 6950 XT и, если не учитывать трассировку лучей, она должна быть где-то между RTX 4070 Ti и RTX 4080 по скорости, но ближе к последней. При имеющейся разнице в рекомендованных ценах, модель XTX смотрится явно предпочтительнее, обеспечивая комфортную игру в 4K-разрешении при максимальных настройках с не менее чем 60 FPS во всех играх.

Если же включить аппаратную трассировку лучей в играх, то конкуренты RX 7900 XTX, созданные Nvidia, получат явное преимущество, и это важно потому, что трассировка лучей появляется во всё большем количестве игр, а нагрузка на соответствующие аппаратные блоки лишь увеличивается со временем. Ситуация с поддержкой трассировки в RDNA3 действительно улучшилась, но не настолько, чтобы догнать даже предыдущее поколение конкурента — Ampere. Но так как в играх трассировки не так уж много до сих пор, то для некоторых пользователей такое решение может показаться оптимальным.

В целом, Radeon RX 7900 XTX — очень хорошая видеокарта за свои деньги, она точно справляется с трассировкой заметно лучше топового GPU предыдущего поколения, и позволяет играть в самые требовательные игры в разрешении 4K с 60 FPS и больше — в том числе и с трассировкой лучей, хотя и с обязательным применением технологии масштабирования разрешения FSR:

Если не брать в расчет разницу в производительности при трассировке лучей, то можно сказать, что AMD и Nvidia пришли к примерно одному уровню производительности совершенно по-разному. Чиплетная организация помогает AMD использовать меньшую площадь основного кристалла при сохранении широкой шины памяти, но это же и является более сложным решением из-за упаковки всех кристаллов на одну подложку, и накладывает определенные ограничения на пропускную способность и задержки связей между чиплетами. Nvidia размещает всё на больших монокристаллах, и в результате RTX 4080 имеет меньшую пропускную способность, чем RX 7900 XTX.

Решения двух компаний близки во многих играх — кроме тех, в которых активно используется трассировка лучей. У AMD есть свое преимущество с точки зрения соотношения цены и производительности. Если сравнивать все видеокарты с учетом их рекомендованных цен, то цена Radeon RX 7900 XT слишком близка к цене RX 7900 XTX, которая всего на $100 выше. Покупка старшей модели может дать до +15%-20% к производительности при всего лишь +10% разнице в рекомендованных ценах, и это несбалансированное соотношение уже сказалось на розничных ценах: XT сейчас продают больше чем на сотню долларов дешевле по сравнению со старшей моделью.

В любом случае, рассматриваемая сегодня Radeon RX 7900 XTX ($1000) стоит дешевле своего прямого конкурента в виде GeForce RTX 4080 ($1200), и при близкой средней производительности в играх она кажется более выгодным вариантом. При выборе необходимо учитывать именно трассировку лучей, которая для кого-то становится всё более важной, а кому-то кажется слишком ресурсоемкой штукой, излишне усложняющей рендеринг, но дающей не слишком впечатляющий результат для подобного падения производительности — все по-своему правы и вольны делать свой собственный выбор.

Ну, а мы переходим к рассмотрению практических особенностей видеокарты Radeon RX 7900 XTX в исполнении компании Sapphire.

Особенности карты Sapphire Nitro+ Radeon RX 7900 XTX Vapor-X 24 ГБ

Сведения о производителе: Компания Sapphire Technology (торговая марка Sapphire) основана в 2001 году в Гонконге как дочерняя структура крупнейшего концерна по выпуску комплектующих для ПК — PC Partner. Сфокусирована на выпуске продукции на основе ядер (графических процессоров) ATI (впоследствии вошедшей в состав AMD). Штаб-квартира — в Гонконге, производство — в Китае. Крупнейший производитель ускорителей серии Radeon. Выпускает также мини-ПК и другую продукцию к.

Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) Sapphire Nitro+ Radeon RX 7900 XTX Vapor-X 24 ГБ 384-битной GDDR6

Sapphire Nitro+ Radeon RX 7900 XTX Vapor-X 24 ГБ 384-битной GDDR6
Параметр Значение Номинальное значение (референс)
GPU Radeon RX 7900 XTX (Navi31)
Интерфейс PCI Express x16 4.0
Частота работы GPU (ROPs), МГц (BIOS 1/BIOS 2) 2680(Boost)—3105(Max) / 2500(Boost)—3070(Max) 2500(Boost)—2990(Max)
Частота работы памяти (физическая (эффективная)), МГц 2500 (20000) 2500 (20000)
Ширина шины обмена с памятью, бит 384
Число вычислительных блоков в GPU 96
Число операций (ALU/CUDA) в блоке 64
Суммарное количество блоков ALU/CUDA 6144
Число блоков текстурирования (BLF/TLF/ANIS) 384
Число блоков растеризации (ROP) 192
Число блоков Ray Tracing 96
Число тензорных блоков -
Размеры, мм 320×125×72 280×115×58
Количество слотов в системном блоке, занимаемые видеокартой 4 3
Цвет текстолита черный черный
Энергопотребление пиковое в 3D, Вт (BIOS 1/BIOS 2) 404/347 355
Энергопотребление в режиме 2D, Вт 25 25
Энергопотребление в режиме «сна», Вт 7 7
Уровень шума в 3D (максимальная нагрузка), дБА (BIOS 1/BIOS 2) 42,5/33,7 48,6
Уровень шума в 2D (просмотр видео), дБА 18,0 18,0
Уровень шума в 2D (в простое), дБА 18,0 18,0
Видеовыходы 1×HDMI 2.1, 2×DisplayPort 2.1, Type-C (DP 2.1) 1×HDMI 2.1, 2×DisplayPort 2.1, Type-C (DP 2.1)
Поддержка многопроцессорной работы нет
Максимальное количество приемников/мониторов для одновременного вывода изображения 4 4
Питание: 8-контактные разъемы 3 2
Питание: 6-контактные разъемы 0 0
Питание: 16-контактные разъемы 0 0
Вес карты с комплектом поставки (брутто), кг 2,9 1,9
Вес карты чистый (нетто), кг 1,95 1,6
Максимальное разрешение/частота, DisplayPort 3840×2160@480 Гц, 7680×4320@165 Гц
Максимальное разрешение/частота, HDMI 3840×2160@144 Гц, 7680×4320@60 Гц
Средняя цена карты Sapphire около 105 тысяч рублей на момент подготовки обзора

Память

Карта имеет 24 ГБ памяти GDDR6 SDRAM, размещенной в 12 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти SK hynix (GDDR6, H56G42AS8D-X014) рассчитаны на номинальную частоту работы в 2500 (20000) МГц.

Особенности карты и сравнение с AMD Radeon RX 7900 XT

Sapphire Nitro+ Radeon RX 7900 XTX Vapor-X (24 ГБ) AMD Radeon RX 7900 XT (20 ГБ)
вид спереди
вид сзади

Мы сравниваем новую карту с референс-картой AMD Radeon RX 7900 XT. Судя по обзорам в интернете, референс-аналог на базе RX 7900 XTX имеет почти ту же PCB.

Хорошо видно, что у обеих карт разведена шина обмена с памятью шириной в 384 бита, просто у RX 7900 XT не установлены две микросхемы памяти, из-за чего шина сузилась до 320 бит, а объем памяти снизился до 20 ГБ. Карта Sapphire немного выше, т. к. имеет большее количество фаз питания, да и в целом система питания более мощная и с приличным запасом (три 8-контактных разъема питания, тогда как у референсного варианта — два таких разъема). Традиционно для Sapphire, схема питания имеет защитные предохранители.

У AMD нет ясной маркировки GPU, всё зашифровано в цифровой код. Дата выпуска — 45-я неделя 2022 года (октябрь). Стоит напомнить, что по крайней мере топовые графические ядра нового поколения AMD имеют чиплетную структуру (а не в виде одного цельного кристалла), и действительно мы видим 7 кристаллов в одной упаковке: 6 небольших кристаллов MCD, в которых размещены Infinity Cache (в каждом MCD по 16 МБ такой кеш-памяти) и контроллеры памяти (каждый MCD имеет 64-битный контроллер), и 1 большой кристалл GCD, в котором размещены потоковые процессоры, шейдерные движки и так далее.

Суммарное количество фаз питания у карты Sapphire Nitro+ Radeon RX 7900 XTX Vapor-X (24 ГБ) — 20, а у референс-аналога — 17. При этом распределение фаз такое: у референс-карты Radeon RX 7900 XT — 14 фаз на ядро и 3 на микросхемы памяти, у карты Sapphire Nitro+ Radeon RX 7900 XTX Vapor-X (24 ГБ) — 17 + 3.

Зеленым цветом отмечена схема питания ядра, красным — памяти. 17 фаз питания ядра управляются двумя ШИМ-контроллерами MP2856 (Monolithic Power Systems), расположенными на оборотной стороне PCB. Каждый такой контроллер рассчитан максимум на 9 фаз.

Тремя фазами питания микросхем памяти управляет ШИМ-контроллер MP2857 (тоже MPS), он также расположен на тыльной стороне карты.

В преобразователе питания, традиционно для всех топовых видеокарт, используются транзисторные сборки DrMOS — в данном случае MP87997 / 87000 (Monolithic Power Systems), каждая из которых рассчитана максимально на 70 А.

Отдельного контроллера, отвечающего за мониторинг карты (отслеживание напряжений и температуры), нет, эти функции AMD традиционно возлагает на сам GPU.

Отметим приличные габариты, которые постепенно становятся стандартными для топовых видеокарт: длина 32 см, высота более 12 см, толщина около 7,3 см. В результате видеокарта занимает 4 слота в системном блоке.

Питание на карту подается через три традиционных 8-контактных разъема питания.

Как у всех карт серии Nitro+, здесь две версии BIOS, которые именуются BIOS 1 (Nitro) и BIOS 2 (Silent). На верхнем торце карты есть соответствующий переключатель.

У переключателя 3 положения, позиция »3» означает выбор версии BIOS через фирменное приложение Sapphire Trixx.

Частота работы памяти в обоих режимах BIOS равна номинальной частоте референс-карты. Boost-значение частоты ядра в режиме BIOS 1 составляет 2680 МГц, что на 7% выше референс-аналога, при этом максимум частоты работы ядра составил чуть выше 3100 МГц (все это дало в среднем прибавку производительности до 5% в разрешении 4K). Boost-значение частоты ядра в режиме BIOS 2 равно референс-значению, а максимум составил 3070 МГц. Энергопотребление карты Sapphire в тестах доходило до 404 Вт в режиме BIOS 1 и до 347 Вт в режиме BIOS 2.

Ручной разгон позволил поднять частоты (при условии стабильной работы карты) до 3273 МГц по ядру и 21760 МГц по памяти, что дало прибавку производительности в 6,2% относительно референсных значений в разрешении 4K.

Карта имеет один из стандартных для современных видеокарт наборов видеовыходов: два DP версии 2.1 и два HDMI 2.1.

Управление работой карты обеспечивается с помощью фирменной утилиты Sapphire Trixx.

Основная информационная вкладка, но управления частотами нет

Переключение между микросхемами BIOS с разными режимами работы можно осуществить не только переключателем на торце карты, но и из Sapphire Trixx.

Самая интересна

Полный текст статьи читайте на iXBT