Обзор видеокарты NVIDIA GeForce RTX 3080, часть 2: долгожданные тесты

Новейшие видеокарты серии GeForce RTX 30 изрядно задержались на пути в редакцию 3DNews — настолько, как мы даже не предполагали, пока работали над первой частью обзора, посвященной архитектуре чипов Ampere и всем характеристикам потребительских устройств на их основе. Но теперь первые партии GeForce RTX 3080 наконец-то потекли в Россию тонким ручейком, и мы получили возможность испытать RTX 3080 на практике, ответив на все волнующие читателей вопросы, кроме одного: сколько в действительности будут стоить передовые ускорители. Планы IT-изданий на публикацию обзоров — не единственное, на что повлияла пандемия. Говорят, что свою лепту в дефицит RTX 3080 внесло осложнение отношений между США и Китаем, но главный виновник — невероятный ажиотаж вокруг новинок. Просто так взять и купить GeForce RTX 3080 сейчас практически невозможно. Геймерам, которые поспешили сбыть с рук GeForce RTX 2080 Ti, в лучшем случае придется отстоять очередь на предзаказ в каком-либо из зарубежных интернет-магазинов — складские запасы там иссякли в течение нескольких часов, если не минут, после того, как NVIDIA дала отмашку на старт продаж, а цены закономерно (и намного) превышают рекомендованные Санта-Кларой $699. Нечего и говорить о том, что RTX 3080 в России — по крайней мере, на первых порах — будет стоить дорого. Но ведь не зря же покупатели так набросились на свежие ускорители NVIDIA? Это мы и собираемся выяснить сегодня.

Однако сразу предупредим, что если вас интересует не только разбор производительности GeForce RTX 3080, но и знакомство с видеокартами Founders Edition, с этим придется еще немного повременить. Фирменные устройства попадут в редакцию позже партнерских вариантов RTX 3080, хотя это по-своему справедливо. В этот раз Founders Edition предельно далек от того, что раньше называли рефененсными платами и представляет собой лимитированный продукт для ценителей прекрасного, который никогда не стоил бы в рознице $699, если бы вместо NVIDIA его конструировал и продавал кто-нибудь из партнеров компании.

Мы рады, что GeForce RTX 3080 в первых бенчмарках на 3DNews представляет устройство Palit. Под этой маркой уже не раз появлялись самые доступные модификации той или иной видеокарты на российском рынке. И хотя RTX 3080 принципиально не может быть дешевым, Palit GeForce RTX 3080 GamingPro OC продемонстрирует, на что может рассчитывать покупатель, который в сложившихся условиях по-прежнему намерен сэкономить

⇡#Технические характеристики GeForce RTX 3080

Хотя официальным спецификациям видеокарт GeForce 30-й серии мы уделили повышенное внимание в архитектурной части обзора, не помешает напомнить читателям, с каким монстром мы имеем дело в лице GeForcе RTX 3080 и графического процессора GA102.

Логика полностью функционального кристалла GA102 представлена семью блоками GPC (Graphics Processing Cluster, крупнейшими масштабируемыми компонентами массива) — против шести в составе TU102. Каждый из них по-прежнему содержит 12 потоковых мультипроцессоров (Streaming Multiprocessor), только набор 32-битных CUDA-ядер, обрабатывающих вещественные числа, внутри SM был удвоен. В результате формула главных исполнительных блоков GA102 включает 10 496 FP32-совместимых CUDA-ядра и 336 блоков наложения текстур.

Однако GeForce RTX 3080 досталась существенно урезанная разновидность GA102, в которой осталось только шесть действующих модулей GPC. Кроме того, два из них не полностью укомплектованы SM«ами. В итоге GeForce RTX 3080 располагает 8 704 шейдерными ALU для операций FP32 и 272 блоками наложения текстур. Тем не менее, это по-прежнему громадный запас сырой вычислительной мощности по сравнению с топ-моделями 20-й серии: у GeForce RTX 2080 SUPER и RTX 2080 Ti соответственно есть лишь 3072 и 4352 CUDA-ядра FP32. Рекомендуем обратиться к первой части обзора, чтобы узнать, каким образом NVIDIA удалось втиснуть на кристалл столько шейдерных ALU, не выходя за пределы и без того колоссального компонентного бюджета в 28 млрд транзисторов.

Для того, чтобы насытить потребность GA102 в быстром доступе к данным, видеокарты GeForce RTX 3080 и RTX 3090 комплектуются оперативной памятью нового типа GDDR6X, которая в случае RTX 3080 обеспечивает пропускную способность в 19 Гбит/с на контакт шины против 14- или 16-гигабитной GDDR6, преобладающей в ускорителях прошлого поколения. При этом совокупная ПСП RTX 3080 несмотря на урезанную до 320 бит шину достигает 760 Гбайт/с. Больше — только у GeForce RTX 3090 (960 Гбайт/с) и Radeon VII (1 Тбайт/с). Легкие опасения может вызвать только объем оперативной памяти в 10 Гбайт, хотя формально и фактически более слабый GeForce RTX 2080 Ti располагает 12 Гбайт VRAM.

ПроизводительNVIDIA
Модель GeForce RTX 2080 GeForce RTX 2080 SUPER GeForce RTX 2080 Ti TITAN RTX GeForce RTX 3080 GeForce RTX 3090
Графический процессор
Название TU104 TU104 TU102 TU102 GA102 GA102
Микроархитектура Turing Turing Turing Turing Ampere Ampere
Техпроцесс 12 нм FFN 12 нм FFN 12 нм FFN 12 нм FFN 8 нм (8N) 8 нм (8N)
Число транзисторов, млн 13 600 13 600 18 600 18 600 28 300 28 300
Тактовая частота, МГц: Base Clock / Boost Clock 1 515/1 710 (Founders Edition: 1 515/1 800) 1 650/1 815 1 350/1 545 (Founders Edition: 1 350/1 635) 1 350/1 770 НД /1 710 НД /1 695
Шейдерные ALU 2 944 3 072 4 352 4 608 8 704 10 496
Блоки наложения текстур (TMU) 184 192 272 288 272 328
Блоки операций растеризации (ROP) 64 64 88 96 96 112
Тензорные ядра 368 384 544 576 272 328
RT-ядра 46 48 68 72 68 82
Оперативная память
Разрядность шины, бит 256 256 352 384 320 384
Тип микросхем GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6X SGRAM GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 1 750 (14 000) 1 937,5 (15 500) 1 750 (14 000) 1 750 (14 000) 1 188 (19 000) 1 219 (19 500)
Объем, Мбайт 8 192 8 192 11 264 24 576 10 240 24 576
Шина ввода/вывода PCI Express 3.0×16 PCI Express 3.0×16 PCI Express 3.0×16 PCI Express 3.0×16 PCI Express 4.0×16 PCI Express 4.0×16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 10 069/10 598 (Founders Edition) 11 151 13 448/14 231 (Founders Edition) 16 312 29 768 35 581
Производительность FP64/FP32 1/32 1/32 1/32 1/32 1/32 1/32
Производительность FP16/FP32 2/1 2/1 2/1 2/1 1/1 1/1
Пропускная способность оперативной памяти, Гбайт/с 448 496 616 672 760 936
Вывод изображения
Интерфейсы вывода изображения DisplayPort 1.4a, HDMI 2.0b DL DVI-D, DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт 215/225 (Founders Edition) 250 250/260 (Founders Edition) 280 320 350
Розничная цена (США, без налога), $ 699 (рекоменд.)/ 799 (Founders Edition) — в момент выхода 699 (рекоменд. в момент выхода) 999 (рекоменд.)/ 1 199 (Founders Edition) — в момент выхода 2 499 699 (рекоменд. в момент выхода) 1499 (рекоменд. в момент выхода)
Розничная цена (Россия), руб. 63 990 (Founders Edition в момент выхода) 56 990 (рекоменд. в момент выхода) 95 990 (Founders Edition в момент выхода) 221 990 (в момент выхода) 63 490 (nvidia.ru) 136 990 (nvidia.ru)

Впрочем, действительное потребление набортной памяти видеокарты современными играми — тонкая тема, которую не раскрывают оценки занятых гигабайтов в мониторинге GPU-Z или MSI Afterburner. Пока 10 Гбайт оперативки GeForce RTX 3080 должно хватить для любых задач обычного пользователя, включая игры на 4К-экране с максимальными настройками детализации. Однако практика последних лет говорит о том, что для долгой службы без апгрейда лучше набирать VRAM с запасом. Неспроста на горизонте уже маячат версии GeForce RTX 3080 с 20 Гбайт GDDR6X, которые, очевидно, внесут дополнительные коррективы в ценовую картину 30-й серии. Также оставим за рамками обзора такой вопрос, как влияние на работу новых топов NVIDIA двух различных поколений интерфейса PCI Express. Консенсус состоит в том, что PCIe 4.0 не приносит в играх никакого практически значимого преимущества, хотя дает AMD лишнюю возможность подчеркнуть достоинства платформы AM4. Другое дело — профессиональные приложения, особенно те, что могут использовать несколько GPU одновременно, но это мы оставим на усмотрение специалистов в таких задачах, как глубинное обучение.

Как бы то ни было, официальные данные о производительности GeForce RTX 3080 таковы, что новинка обеспечивает вдвое более высокую частоту смены кадров по сравнению с базовой версией GeForce RTX 2080 — в условиях, идеальных для архитектуры Ampere, то есть при разрешении 4К и с трассировкой лучей, но тем не менее. Мы намерены выяснить, отработает ли RTX 3080 такую заявку, а заодно проверить, каково действительное энергопотребление ускорителя. Как ни крути, одночиповые игровые платы NVIDIA впервые перевалили за отметку 300 Вт, а ведь RTX 3080 — это даже не флагман серии. Но сперва внимательно изучим видеокарту, которая удостоилась чести представлять новую архитектуру в первых тестах — Palit GeForce RTX 3080 GamingPro OC.

⇡#Palit GeForce RTX 3080 GamingPro OC: конструкция, комплект поставки

Партнеры NVIDIA и AMD не любят выпускать видеокарты, лишенные хотя бы номинального разгона. Вот и Pait GamingPro потому несет в названии индекс OC, что графический процессор в ней пускай совсем чуть-чуть, но все-таки разогнан. Оверклокинг сводится к добавочным 30 МГц проектной тактовой частоты под игровой нагрузкой (Boost Clock), поэтому спецификации ускорителя вполне можно приравнять к референсным с практической точки зрения.

Тем более сильное впечатление производит система охлаждения, которую Palit водрузила на чип GA102. Видеокарта занимает в корпусе ПК три полных слота расширения, что могли себе позволить далеко не все разновидности GeForce RTX 2080, включая те, которые разогнаны поболее Pait GamingPro. Не зря компания приложила к своему продукту акриловую подпорку, которая удерживает свободный край платы в горизонтальном положении.

Однако кулер палитовской версии GeForce RTX 3080 интересен не только своими габаритами. Когда все взгляды прикованы к видеокартам Founders Edition, задающим стандарты если не в эффективности охлаждения (это мы еще выясним в свое время), то уж точно в эстетике, партнеры NVIDIA, которые не могут себе позволить расходовать на один только кулер свыше $150 (по слухам, именно в такую сумму обходится производство СО для одной платы Founders Edition), стремятся так или иначе выделиться из общей массы.

При взгляде спереди Palit GeForce RTX 3080 GamingPro OC не представляет собой ничего экстраординарного: кажется, что перед нами обычный кулер с тремя вентиляторами диаметром 95 мм, только очень толстый. Есть и практически обязательная для современных высокопроизводительных видеокарт RGB-подсветка.

Но если перевернуть видеокарту, можно убедиться в том, что поток воздуха от правого вентилятора проходит насквозь через массив радиаторных ребер и пластину на оборотной стороне PCB — прямо как в Founders Edition. Не удивимся, если и другие производители последуют в этой детали примеру NVIDIA не столько из стремления подражать законодателю мод, сколько потому, что схемотехника ускорителей с памятью GDDR6X требует размещать чипы RAM как можно ближе к GPU и таким образом располагает к коротким печатным платам. Такой поход к устройству системы охлаждения мы уже видели когда-то в исполнении SAPPHIRE — тоже на базе короткой PCB ускорителей Radeon R9 Fury.

Кстати, нельзя не похвалить Palit за то, что пластина поверх печатной платы сделана не из бесполезного и даже вредного для охлаждения пластика, а из алюминия и прижата к текстолиту через несколько термопрокладок.

Под кожухом системы охлаждения скрывается вполне типичный, разве что с поправкой на размеры, двухсекционный радиатор, пронизанный несколькими толстыми теплотрубками. Тепло с кристалла GPU снимает никелированная медная подошва, а микросхемы памяти и силовые каскады VRM контактируют с массивной металлической рамой.

Кулер GeForce RTX 3080 GamingPro OC выглядит подобающе мощным для видеокарты со штатным энергопотреблением в 320 Вт и, как мы успеем убедиться, отличается одновременно высокой эффективностью и низким уровнем шума. Когда температура GPU меньше 60 °C, активное охлаждение ему вообще не требуется, а вращение вентиляторов прекращается. Единственная претензия, которую можно предъявить к конструкции этой видеокарты (да и многих других тоже), состоит в том, что весь отработанный горячий воздух система охлаждения оставляет внутри корпуса ПК. При таком устройстве, когда ребра радиатора идут параллельно решетке в торце кожуха, ее вполне можно было заменить глухой пластиной с вырезами только под разъемы видеовыходов — от этого бы ничего не изменилось.

К слову о видеовыходах GeForce RTX 3080, отсутствие характерного для ускорителей 20-й серии разъема USB Type-C с поддержкой DisplayLink не является мерой экономии со стороны Palit. Этот стандарт, предназначенный для подключения шлемов VR одним проводом, как говорится, не взлетел и в итоге был отвергнут NVIDIA.

⇡#Palit GeForce RTX 3080 GamingPro OC: печатная плата

Как мы уже отметили в самом начале, разновидности GeForce 30-й серии под маркой Founders Edition некорректно называть референсными устройствами. Тем не менее NVIDIA предоставляет партнерам настоящий референсный дизайн PCB, чтобы помочь наладить выпуск видеокарт первой волны с фирменными системами охлаждения, а под кулером бюджетного ускорителя иногда можно обнаружить и саму эталонную плату с маркировкой NVIDIA. Печатная плата Palit GeForce RTX 3080 GamingPro OC представляет собой примерно то же самое: фотографии еще нескольких PCB для чипов GA102, которые всплыли в интернете, похожи на то, что вы видите на фотографиях, и очевидно являются вариациями на одну и ту же тему.

Как бы то ни было, у рядового покупателя, не заинтересованного в соревновательном оверклокинге, вряд ли найдется повод придраться к плате RTX 3080 GamingPro OC. Референсный дизайн позволяет организовать 16-фазное питание графического процессора при помощи двух восьмифазных контроллеров On Semiconductor NCP81610, хотя в данном случае на плате распаяно только пять силовых каскадов одного VRM. Памяти GDDR6X выделено вплоть до четырех фаз, но компоненты двух из них, опять-таки отсутствуют. В фазах питания графического процессора применяются силовые каскады AOZ5311NQI от Alpha & Omega с номинальным током 50 А.

Печатная плата Palit GeForce RTX 3080 GamingPro OC не нуждается в более подробных комментариях. Ускорители Founders Edition обслуживают VRM, состоящий в общей сложности из 18 фаз, в них применяются исключительно твердотельные конденсаторы, но среди партнерских разновидностей RTX 3080 и RTX 3090 мы еще не раз увидим именно такой — удешевленный, но вполне достойно укомплектованный — дизайн.

⇡#Тестовый стенд, методика тестирования

Тестовый стенд
CPU Intel Core i9–9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота)
Материнская плата ASUS MAXIMUS XI APEX
Оперативная память G.Skill Trident Z RGB F4–3200C14D-16GTZR, 2×8 Гбайт (3200 МГц, CL14)
ПЗУ Intel SSD 760p, 1024 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Corsair Hydro Series H115i
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты AMD Radeon Software Adrenalin 2019 Edition 20.8.3
ПО для GPU NVIDIA
Все видеокарты NVIDIA GeForce Game Ready Driver 456.16
Игры
Игра (в порядке даты выхода) API Метод тестирования Настройки графики Полноэкранное сглаживание
Strange Brigade Vulkan Встроенный бенчмарк Макс. качество графики AA Ultra
Shadow of the Tomb Raider DirectX 12 Встроенный бенчмарк Макс. качество графики. DXR выкл., DLSS выкл. TAA
Assassin’s Creed Odyssey DirectX 11 Встроенный бенчмарк Макс. качество графики AA High (TAA)
Battlefield V DirectX 12 Миссия Liberte + OCAT Макс. качество графики. DXR выкл., DLSS выкл. TAA High
Metro Exodus DirectX 12 Встроенный бенчмарк Макс. качество графики. DXR выкл., DLSS выкл, Shading Rate 100% TAA
Total War: THREE KINGDOMS DirectX 12 Встроенный бенчмарк (Battle Benchmark) Макс. качество графики TAA
Control DirectX 12 OCAT Макс. качество графики TAA
Borderlands 3 DirectX 12 Встроенный бенчмарк Макс. качество графики TAA
Red Dead Redemption 2 Vulkan Встроенный бенчмарк Макс. качество графики TAA High
DOOM Eternal Vulkan Начало миссии Mars Core + OCAT Макс. качество графики TAA
Игры (с трассировкой лучей)
Игра (в порядке даты выхода) API Метод тестирования Полноэкранное сглаживание
Battlefield V DirectX 12 Миссия Liberté + OCAT Макс. качество графики. DXR Raytrace Reflection Quality: Ultra TAA/DLSS
Shadow of the Tomb Raider DirectX 12 Встроенный бенчмарк Макс. качество графики. Ray Traced Shadows Quality: Ultra TAA/DLSS
Metro Exodus DirectX 12 Встроенный бенчмарк Макс. качество графики. Shading Rate 100%. Ray Trace: Ultra TAA/DLSS
Quake II RTX Vulkan Timedemo, запись demo1.dm2 Макс. качество графики TAA
Control DirectX 12 OCAT Ray Tracing Preset: High TAA/DLSS 2.0
Minecraft with RTX Beta DirectX 12 Бенчмарк в мире Portal Pioneers + OCAT Макс. дальность рендеринга геометрии и частиц Нет/DLSS 2.0

В большинстве тестовых игр показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (или утилита OCAT, если его нет).

Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения. Red Dead Redemption 2 является исключением: ее встроенный бенчмарк регистрирует 1-й процентиль времени рендеринга кадра, из которого выводится соответствующая кадровая частота.

Вычисления общего назначения, кодирование/декодирование видео
Приложение Настройки API
AMD NVIDIA AMD NVIDIA
Adobe Premiere Pro CC 2020 PugetBench for Premiere Pro 0.88 GPU Effects: живое воспроизведение (ProRes 422, 4K@59,94 FPS) OpenCL CUDA
GPU Effects: экспорт в H.264 40 Мбит/с и ProRes 422HQ (4K@59,94 FPS)
Blender 2.9 Демо Class Room с сайта Blender Foundation Рендерер Cycles. Feature Set: Supported. Размер тайла: 256 × 256 OpenCL CUDA/OptX
Демо Nissan GTR от AMD Рендерер AMD Radeon ProRender OpenCL
DXVA Checker 4.1.2, Decode Benchmark H.264 (Microsoft H264 Video Decoder) 1920 × 1080 (High Profile, L4.1); 3840 × 2160 (High Profile, L5.1) D3D11VA
H.265 (Microsoft HEVC Video Extensions) 1920 × 1080 (Main Profile, L4.0); 3840 × 2160 (Main Profile, L5.0); 7680 × 4320 (Main Profile, L6.0)
VP9 (Microsoft VP9 Video Extensions) 1920 × 1080; 3840 × 2160; 7680 × 4320
FFmpeg 4.2.1, кодирование H.264 1920 × 1080 -c: v h264_amf -quality speed -coder cabac -level 4.1 -refs 1 -b: v 3M -c: v h264_nvenc -preset fast -coder cabac -level 4.1 -refs 1 -b: v 3M AMF NVENC
3840 × 2160 -c: v h264_amf -quality speed -coder cabac -level 5.1 -refs 1 -b: v 7.5M -c: v h264_nvenc -preset fast -coder cabac -level 5.1 -refs 1 -b: v 7.5M
FFmpeg 4.2.1, кодирование H.265 1920 × 1080 -c: v hevc_amf -quality speed -level 4 -b: v 3M -c: v hevc_nvenc -preset fast -level 4 -b: v 3M
3840 × 2160 -c: v hevc_amf -quality speed -level 5 -b: v 7.5M -c: v hevc_nvenc -preset fast -level 5 -b: v 7.5M
7680 × 4320 Н/Д -c: v hevc_nvenc -preset fast -level 6 -refs 1 -b: v 20M
REDCINE-X PRO Декодирование файлов RED R3D с разрешением 4К, 6К и 8К OpenCL CUDA

Мощность видеокарт регистрируется отдельно от CPU и прочих компонентов ПК с помощью амперметра JUNTEK VAT-1050 и устройства NVIDIA PCAT. Чтобы одновременно измерить ток, проходящий по разъемам дополнительного питания и слоту материнской платы, видеокарта подключается через жесткий райзер PCI Express x16, в котором линии питания разорваны и выведены на отдельный кабель.

В качестве нагрузки для тестов мощности и уровня шума используется игра Crysis 3 при разрешении 3840 × 2160 без полноэкранного сглаживания и при максимальных параметрах качества графики, а также стресс-тест FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x). Замеры всех параметров выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются.

⇡#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

  • Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт);
  • NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) ;
  • NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) ;
  • NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11 Гбит/с, 11 Гбайт) ;
  • NVIDIA GeForce GTX 1080 FE (1607/1733 МГц, 10 Гбит/с, 8 Гбайт) ;
  • AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт) ;
  • AMD Radeon VII (1400/1750 МГц, 2 Гбит/с, 16 Гбайт) .

Прим. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства. Видеокарты нереференсного дизайна приведены в соответствие с референсными параметрам (или приближены к последним) при условии, что это можно сделать без ручной правки кривой тактовых частот. В противном случае (ускорители серии NVIDIA GeForce 16, а также GeForce RTX 2070/2080/2080 Ti Founders Edition) используются настройки производителя.

⇡#Тактовые частоты, энергопотребление, температура, уровень шума и разгон

Прежде чем приступить к бенчмаркам Palit RTX 3080 GamingPro OC, хотим рассказать о пополнении в нашем тестовом инструментарии. Вместе с комплектом LDAT, который позволяет регистрировать время задержки между вводом и реакцией изображения в играх, мы получили от NVIDIA новое средство измерения потребляемой мощности для плат расширения PCI Express под названием PCAT (Power Capture Analysis Tool).

В большинстве обзоров графических ускорителей используются косвенные методы оценки энергопотребления — при помощи программных инструментов драйвера видеокарты или чаще всего по совокупной мощности компьютера, — которые не позволяют проводить точное сравнение устройств различных производителей и рассчитывать такой показатель, как быстродействие на ватт мощности, характеризующий новые достижения в проектировании GPU. Так, современные видеокарты на чипах NVIDIA способны отдавать через API данные о своем общем энергопотреблении (включая оперативную память, вентиляторы охлаждения и потери КПД на преобразование напряжения) благодаря тому, что для контроля мощности в них применяются шунты на всех линиях 12 В. В то же время система питания ускорителей AMD устроена проще и позволяет отслеживать лишь мощность самого графического процессора на выходе силовых каскадов VRM без учета остальных компонентов. Ну, а замеры полной мощности системы бытовым ваттметром, очевидно, не дают возможности исключить из уравнения неодинаковую загрузку центрального процессора при использовании GPU различных классов производительности.

Единственный способ раз и навсегда устранить перечисленные ограничения состоит в том, чтобы изолировать питание видеокарты от материнской платы тестового стенда и контролировать ток непосредственно между подопытным устройством и БП. В обзорах новых GPU мы уже не первый год следуем именно такой методике, когда видеокарта подключается к материнской плате жестким райзером, в котором разорваны линии питания, а весь ток и, следовательно, потребляемая мощность измеряется универсальным цифровым ваттметром при помощи шунта, рассчитанного на несколько сотен ватт.

Инструмент PCAT работает точно таким же образом. Он состоит из платы микроконтроллера с восьмиконтактными разъемами питания PCI Express и переходника, изолирующего видеокарту от материнской платы. Таким образом все питание поступает на ускоритель через PCAT, а микроконтроллер регистрирует ток, проходящий через кабели и слот PCI Express. Для оценки энергопотребления на глазок у PCAT есть миниатюрный OLED-экран, но в отличие от нашего ваттметра устройство NVIDIA можно подключить к компьютеру по USB и записывать лог потребляемой мощности — совокупной или, если требуется, мощности слота PCI Express и разъемов дополнительного питания в отдельности.

Заметим, что программное обеспечение PCAT, как и LDAT, не обязательно запускать на тестовом компьютере, а в том случае, когда оно работает на отдельной машине, у PCAT нет никакой возможности узнать, какое именно железо мы тестируем. Соответственно, не стоит волноваться о том, получат ли ускорители AMD справедливые оценки мощности в сравнении с новинками NVIDIA. Что касается точности измерения, то замеры энергопотребления видеокарт под нагрузкой с помощью PCAT не разошлись с показателями наших собственных инструментов, откалиброванных по падению напряжения на шунте, более чем на 2%. Так что на первых порах мы смело можем оперировать старыми и новыми данными вперемешку, но в обзорах всех будущих GPU целиком перейдем на PCAT. В конце концов, инструмент NVIDIA намного удобнее в работе, не говоря о том, что выглядит куда симпатичнее наших самоделок.

Однако вернемся к Palit RTX 3080 GamingPro OC. Как мы уже заметили, перед нами разогнанный вариант GeForce RTX 3080, но оверклокинг в данном случае сводится к чисто символической величине 30 МГц по частоте Boost Clock, а резерв мощности видеокарты соответствует референсным 320 Вт. Как следствие, заводской разгон видеокарты не должен исказить общую картину сравнения GeForce RTX 3080 с другими ускорителями, все из которых представлены в бенчмарках референсными моделями.

NVIDIA оценивает диапазон тактовых частот GeForce RTX 3080 более консервативно, чем у его формальных предшественников — RTX 2080 и RTX 2080 SUPER. В действительности так оно и есть, хотя дистанция между устойчивой тактовой частотой ядра Palit RTX 3080 GamingPro OC и GeForce RTX 2080 SUPER Founders Edition оказалась немногим больше 50 МГц (1854 и 1907 МГц соответственно) под мощной нагрузкой в Crysis 3. Да, мы по-прежнему используем эту игру в качестве стресс-теста: достаточно сказать, что RTX 3080 стал первым ускорителем на нашей практике, который добился в Crysis 3 фреймрейта 60 FPS при разрешении 4К (даже без полноэкранного сглаживания MSAA!). А вот по сравнению с чипом TU102 на плате GeForce RTX 2080 Ti новый GPU тактуется на 131 МГц выше невзирая на полуторакратную разницу в транзисторных бюджетах. Жаль только, что универсальные программные инструменты для мониторинга и разгона видеокарт еще не получили доступ к датчикам питающего напряжения GPU, чтобы мы узнали, как смена техпроцесса подействовала на этот параметр.

Парадоксально, что NVIDIA раздала (избранным IT-изданиям, но тем не менее) комплекты для измерения мощности ускорителей именно в то время, когда ее потребительские устройства достигли беспрецедентно высоких TDP. Но может быть, в том-то и дело, что мы проверим мощность Ampere на практике и убедимся, что она не так страшна, как следует из его официальных ТТХ. Увы, по крайней мере Palit RTX 3080 GamingPro OC действительно расходует не меньше 314 из положенных по паспорту 320 Вт мощности. Единственная видеокарта, не считая «двухголовых» устройств, в нашей базе данных, которая превосходит по мощности RTX 3080, это Radeon RX Vega 64 с штатной СЖО, а все предыдущие топ-модели NVIDIA (включая 250-ваттные RTX 2080 SUPER и RTX 2080 Ti) новинка оставила далеко позади.

При таком внушительном энергопотреблении и, следовательно, тепловыделении GPU, нужно отдать должное системе охлаждения Palit. Температура в пределах 70 °C под нагрузкой еще не является признаком качества — просто именно так настроена автоматика кулера, а вот удержать уровень шума на уровне 38 дБА (ниже, чем у старших моделей Founders Edition прошлого поколения) куда сложнее.

Рабочие параметры под нагрузкой (Crysis 3)
Видеокарта Настройки Тактовая частота GPU, МГц Напряжение питания GPU, В Частота вращения вентиляторов, об/мин (% от макс.) Частота вращения вентиляторов 2, об/мин (% от макс.)
Средн. Макс. Средн. Макс. Средн. Средн.
Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт) 1854 1950 Н/Д Н/Д 1823 (46%) 1823 (46%)
Palit GeForce RTX 3080 GamingPro OC (+50 МГц, 21,2 Гбит/с, 10 Гбайт) +9% мощности 1940 2010 Н/Д Н/Д 1894 (48%) 1894 (48%)
NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11000 Мбит/с, 11 Гбайт) 1735 1810 0,96 1,01 2377 (50%) Н/Д
NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) 1907 1920 1,03 1,04 1969 (53%) 1969 (53%)
NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) 1723 1860 0,91 1,03 2082 (56%) 2082 (56%)
AMD Radeon VII (1800 МГц, 2000 Мбит/с, 16 Гбайт) 1756 1786 Н/Д Н/Д 2617 (Н/Д) Н/Д
AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт) Термопаста ARCTIC MX-2 1795 1819 1,07 1,18 2102 (43%) Н/Д

Прим. Измерение всех параметров выполняется после прогрева GPU и стабилизации тактовых частот.

Мы не питали больших надежд на оверклокинг GeForce RTX 3080 и, как показал опыт, видеокарта действительно не поддается разгону, который выражается в сколько-нибудь значимом приросте игрового быстродействия. Начнем с того, что прошивка Palit GamingPro OC позволяет лишь на 9% увеличить резерв мощности платы, который является главным препятствием для наращивания тактовых частот графического процессора. А в рамках установленного TDP автоматика GPU Boost уже практически исчерпывает частотный потенциал. Нам удалось добавить 50 МГц к проектной частоте Boost Clock, что выражается в 85 МГц реальной тактовой частоты под игровой нагрузкой (5% от исходных 1854 МГц). Надо ли говорить, что это капля в море, которая едва ли повлияет даже на самые чувствительные бенчмарки. К тому же, оверклокинг графического ядра влечет за собой рост и без того чрезвычайно высокой потребляемой мощности на 19 Вт — к счастью, хотя бы без последствий для температуры и шума системы охлаждения.

Быть может, в GeForce RTX 3080 выгоднее разгонять оперативную память? Задел для оверклокинга чипов GDDR6X со штатной пропускной способностью 19 Гбит/с, которые применяются в GeForce RTX 3080, существует, но раскрыть его не так-то просто. Для того, чтобы найти предел стандартных чипов GDDR6 при неизменных таймингах, достаточно постепенно увеличивать тактовую частоту, пока видеокарта не потеряет стабильность или не появятся графические артефакты на экране. GDDR6X ведет себя коварно: поначалу мы смогли довести пропускную способность чипов до 21,8 Гбит/с на контакт, но скоро обнаружили, что чем дальше она уходит за пределы 21,2 Гбит/с, тем сильнее не возрастает, а наоборот, падает производительность. Возможно, к делу подключились те самые алгоритмы настройки сигнала в шине GDDR6X, о которых говорила NVIDIA, поддерживающие стабильность даже в условиях сильной деградации соотношения сигнал-шум.

Кстати, GPU-Z и подобные программы некорректно определяют командную частоту GDDR6X на уровне 1 188 МГц, хотя на самом деле она вдвое выше. Если в будущем не исправят эту ошибку, привыкайте умножать число на 16, а не на 8, как с GDDR6, чтобы получить итоговую пропускную способность чипов.

⇡#Игровые тесты ( 1920 × 1080)

Постоянные читатели железного раздела 3DNews наверняка заметили, что состав тестовой методики для новых GPU сильно изменился. Мы исключили из программы синтетическую нагрузку — как 3DMark в разделе игрового 3D-рендеринга, так и аналогичные тесты вычислений общего назначения. Да, 3DMark неплохо подходит для того, чтобы быстро оценить разницу между близкими по характеристикам видеокартами. Но когда речь идет о новом поколении графических процессоров, которое претендует на качественно иной уровень производительности, изучать «попугаи» в 3DMark не имеет никакого смысла. Он давно перестал быть альтернативой играм, основанных на разных графических движках и работающих с разными API, и порой изрядно расходится с действительностью в оценках GPU той или иной архитектуры. Бенчмарки с трассировкой лучей и масштабированием DLSS в 3DMark неплохо иллюстрировали возможности ускорителей GeForce RTX 20-й серии в их первые месяцы, но теперь вдобавок к играм, использующим богатые функции «гибридного» рендеринга, появились полностью трассированные модификации Quake II и Minecraft. В итоге мы решили упразднить тесты в 3DMark и вместо них расширить арсенал настоящих игр, который теперь наполовину состоит из проектов, поддерживающих трассировку лучей в том или ином объеме.

С другой стороны, нужно пояснить, почему в списке тестов отсутствуют некоторые игровые новинки 2020 года, отличившиеся высокими запросами к железу и на первый взгляд идеально подходящие для проверки таких устройств, как GeForce RTX 3080. Речь идет о Horizon Zero Dawn и Microsoft Flight Simulator, которым на 3DNews посвящены масштабные сравнительные тесты. Дело в том, что обе игры вышли на PC относительно недавно, и пока не отличаются высокой стабильностью вообще и быстродействия в частности. Рисковать повторяемостью результатов бенчмарков ради того, чтобы тестовая методика состояла из самых свежих игр, мы не готовы, так что Horizon Zero Dawn и MSFS придется постоять в очереди, пока не закончится первая волна патчей, исправляющих ошибки.

Итак, приступим к анализу тестовых результатов в стартовом разрешении 1080p, которое, честно говоря, совершенно не подходит для того, чтобы раскрыть потенциал ускорителей класса GeForce RTX 3080. А жаль, ведь именно в таком режиме современное железо может развивать кадровую частоту свыше 100 FPS не только в легких киберспортивных играх, но и в требовательных ААА-проектах, что положительно сказывается на времени реакции — особенно на экране с высокой частотой. Недавно мы отдельно разбирали этот вопрос в ходе аппаратного тестирования задержек с помощью LDAT и пришли к выводу, что FPS полезно наращивать за пределы частоты обновления монитора, будь у в

Полный текст статьи читайте на 3DNews