Обзор видеокарты NVIDIA GeForce RTX 3070 Founders Edition: убийца королей

Сегодня мы продолжим знакомство с игровыми видеокартами нового поколения на «зеленых» чипах Ampere, но это знакомство — в полном соответствии с требованиями карантина — остается дистанционным для большинства наших читателей. Многие уже наверняка готовы к апгрейду, не дожидаясь, чем ответит AMD на дебют ускорителей NVIDIA 30-й серии, однако GeForce RTX 3080 и RTX 3090 по-прежнему трудно купить в российской рознице за более-менее приемлемую сумму, а самые заманчивые по соотношению цена-качество модификации Founders Edition все еще недоступны на сайте чипмейкера даже по предзаказу.

Будем надеяться, что выход GeForce RTX 3070 изменит ситуацию к лучшему. Ведь это, в отличие от двух старших моделей, по-настоящему массовый продукт. Да, RTX 3080 и RTX 3090 подняли планку быстродействия ускорителей NVIDIA и несмотря на завышенные розничные цены сумели взбодрить траекторию роста FPS на доллар, приунывшую со времен GeForce 10-й серии. Однако для основной массы геймеров флагманские видеокарты представляют чисто теоретический интерес и повод для дискуссий в комментариях к обзорам. GeForce RTX 3070 гораздо ближе к народу, тем более что эта модель в серии осенних релизов NVIDIA лучше всего иллюстрирует разворот ценовой политики чипмейкера.

Дело в том, что RTX 3070 сулит игровую производительность на уровне GeForce RTX 2080 Ti — самой переоцененной модели 20-й серии, которая стоила не меньше $999 ($1199 за Founders Edition) — по стоимости RTX 2070, то есть всего $499. Можно сколько угодно рассуждать о том, как прогрессировали возможности GPU по сравнению с прошлым поколением, но 50-процентная скидка на доступ к прежде флагманскому уровню быстродействия выглядит убедительнее всего. Конечно, при условии, что ожидания не разойдутся с действительностью, но именно это мы намерены выяснить в обзоре новинки.

⇡#Графический процессор GA104

Главное, что отличает семейство ускорителей 30-й серии от предыдущего поколения и что в конечном счете стало одной из причин ударного роста производительности, это новая сегментация модельного ряда. Согласно ей устройство на 80-й позиции комплектуется флагманским GPU (GA102, пусть и урезанным в составе GeForce RTX 3080), а 70-й модели достался чип второго эшелона GA104. Линейка GeForce 20 была устроена совершенно по-другому: RTX 2080 основан на графическом процессоре TU104, а базовая версия RTX 2070 — на TU106. Таким образом, две ключевые модели 30-й серии опираются на более мощную кремниевую базу в рамках своего поколения, чем их формальные предшественники.

Мы уже прекрасно знаем, к чему это привело в случае GeForce RTX 3080: NVIDIA вернулась к темпам роста производительности, которых мы не видели со времен прорывной для своего времени архитектуры Maxwell. Примерно то же самое произошло с RTX 3070: новинка пришла на замену базовой версии RTX 2070, но с технической, а не ценовой точки зрения ее непосредственным предшественником является GeForce RTX 2080, а также RTX 2070 SUPER на чипе TU104. Так что сравнение графического процессора GA104 и кристаллов прошлого поколения следует начинать именно с TU104.

ПроизводительNVIDIA
Название TU104 TU102 GA104 GA102
Где используется GeForce RTX 2070 SUPER, RTX 2080, RTX 2080 SUPER GeForce RTX 2080 Ti, TITAN RTX GeForce RTX 3070 GeForce RTX 3080, RTX 3090
Микроархитектура Turing Turing Ampere Ampere
Техпроцесс, нм 12 нм FFN 12 нм FFN 8 нм (8N) 8 нм (8N)
Число транзисторов, млн 13 600 18 600 17 400 28 300
Площадь чипа, мм2 545 754 392,5 628
Число SM/TPC/GPC
Streaming Multiprocessors (SM) 48 72 48 84
Thread Processing Clusters (TPC) 24 36 24 42
Graphics Processing Clusters (GPC) 6 6 6 7
Конфигурация потокового мультипроцессора (SM)
CUDA-ядра FP16 Нет Нет Нет Нет
CUDA-ядра FP32 4 × 16 4 × 16 4 × 32 4 × 32
CUDA-ядра FP64 2 2 2 2
CUDA-ядра INT32 4 × 16 4 × 16 4 × 16 4 × 16
ALU специального назначения (SFU) 4 × 4 4 × 4 4 × 4 4 × 4
Тензорные ядра 4 × 2 4 × 2 4 × 1 4 × 1
RT-ядра 1 1 1 1
Блоки наложения текстур (TMU) 4 4 4 4
Объем регистрового файла, Кбайт 256 256 256 256
Объем кеша L1, Кбайт 32/64 из 96 (общий с разделяемой памятью) 32/64 из 96 (общий с разделяемой памятью) До 64 из 128 (общий с разделяемой памятью) До 64 из 128 (общий с разделяемой памятью)
Объем разделяемой памяти, Кбайт 32/64 из 96 (общий с кешем L1) 32/64 из 96 (общий с кешем L1) До 100 из 128 (общий с кешем L1) До 100 из 128 (общий с кешем L1)
Программируемые вычислительные блоки GPU
CUDA-ядра FP16 Нет Нет Нет Нет
CUDA-ядра FP32 3 072 4 608 6 144 10 752
CUDA-ядра FP64 96 144 96 168
CUDA-ядра INT32 3 072 4 608 3 072 5 376
ALU специального назначения (SFU) 768 1 152 768 1 344
Тензорные ядра 384 576 192 336
RT-ядра 48 72 48 84
Блоки GPU фиксированной функциональности
Блоки наложения текстур (TMU) 192 288 192 336
Блоки операций растеризации (ROP) 64 96 92 112
Конфигурация памяти
Объем кеша L2, Кбайт 4 096 6 144 4 096 6 144
Разрядность шины RAM, бит 256 384 256 384
Тип микросхем RAM GDDR6 GDDR6 GDDR6 / (GDDR6X?) SGRAM GDDR6/GDDR6X SGRAM
Интерфейс NVLINK 1 × NVLink 2.0×8 2 × NVLink 2.0×8 Нет 4 × NVLink 3.0×4
Интерфейс PCI Express 3.0×16 3.0×16 3.0×16 3.0×16

Макроархитектура старого и нового чипов имеет много общих черт. Оба графических ядра содержат по шесть блоков GPC (Graphics Processing Cluster, крупнейших масштабируемых компонентов в логике «зеленых» GPU) и в общей сложности по 48 потоковых мультипроцессоров (SM). При этом массив 32-битных CUDA-ядер, обрабатывающих вещественные числа, внутри потокового мультипроцессора SM удвоен по сравнению с Turing. Таким образом, при неизменном количестве SM теоретическая производительность GPU на такт в операциях над 32-битными вещественными числами стала в два раза выше, чем прежде: у TU104 в общей сложности 3 072 FP32-совместимых CUDA-ядра, а у GA104 — целых 6 144.

При этом транзисторный бюджет GPU, разумеется, распух, но не так сильно, как если бы NVIDIA просто увеличила количество SM или GPC на кристалле, сохранив организацию компонентов, присущую Turing. GA104 и так приближается по числу транзисторов к уходящему на пенсию GPU первого эшелона. Количество целочисленных ALU внутри SM осталось прежним, равно как и пропускная способность планировщиков. О реальном быстродействии, близком к проектным значениям Ampere, может идти речь только при исключительно вещественночисленной нагрузке, однако как в играх, так и в массе рабочих приложений, новый подход, принятый инженерами NVIDIA, уже доказал свою эффективность.

Пожалуй, удвоенное число CUDA-ядер FP32 внутри потокового мультипроцессора — главное, что нужно знать об архитектуре новых GPU. В отличие от Turing, Ampere ориентирован не на инновационные технологии, а сугубо на рост производительности. Конечно, здесь не обошлось без оптимизаций различного рода, которые относятся к парадным функциям графических процессоров NVIDIA — трассировке лучей и машинному обучению. Так, GA104 не превосходит TU104 по числу RT-ядер и содержит вдвое меньше тензорных блоков. Но Ampere более эффективно выполняет рейтрейсинг (причем оптимизации относятся и к прохождению структур BVH специализированной логикой, и, потенциально, к общему быстродействию трассированных эффектов в рамках гибридного рендеринга), а производительность тензорных блоков удвоилась, что позволило сэкономить на их количестве.

Для того, чтобы сформировать исчерпывающее представление о возможностях кремния Ampere, рекомендуем нашу аналитическую статью. Заострим внимание лишь на еще одной особенности, хорошо заметной в спецификациях GA104. Блоки операций растеризации (ROP) Ampere больше не привязаны к контроллерам оперативной памяти и стали компонентами GPC. Таким образом NVIDIA привела в соответствие между собой пропускную способность начальной и конечной стадий конвейера рендеринга. Растеризатор внутри GPC выдает 16 цветных пикселов за такт, а каждый ROP смешивает или закрашивает один пиксел. Теперь, когда GPC содержит 16 ROP, установилось соотношение 1:1 между пропускной способностью растеризаторов и блоков растровых операций, не зависящее от конфигурации шины памяти. Поэтому несмотря на то, что GA104 и TU104 сообщаются с VRAM 256-битной шиной, общее количество ROP на чипе нового поколение в полтора раза выше — 96 против 64, — что положительно сказывается на производительности в режиме высокого разрешения.

Однако нужно поставить вопрос, удовлетворяет ли пропускная способность 256-битной шины памяти требованиям мощного графического ядра GA104. Старший кремний,  GA102, сохранил 384-битную шину VRAM, которой пользуется флагманский чип семейства Turing, но GeForce RTX 3080 и RTX 3090 вышли из положения благодаря скоростной памяти GDDR6X. RTX 3070 является экономным предложением по сравнению со старшими моделями 30-й серии и, как следствие, лишен подобной роскоши. Пока даже не знаем, существует ли в принципе техническая возможность комбинировать GA104 с чипами GDDR6X, которой NVIDIA могла бы воспользоваться в будущем, чтобы выпустить видеокарту под маркой RTX 3070 Ti или 3070 SUPER.

Технические характеристики

GeForce RTX 3070 основан на частично урезанном кристалле GA104, но потери быстродействия в данном случае совершенно незначительны: кристалл лишился всего двух SM и, соответственно, 256 FP32-совместимых шейдерных ALU. Сделано это скорее для того, чтобы увеличить количество пригодных к эксплуатации чипов, нежели для сегментации модельного ряда ускорителей. Как бы то ни было, при тактовых частотах GPU, обозначенных в спецификациях, удвоенный набор вещественночисленных CUDA-ядер внутри SM архитектуры Ampere позволяет RTX 3070 претендовать на уровень быстродействия, недоступный даже флагманской модели прошлого поколения, не говоря уже об RTX 2070 или RTX 2070 SUPER. Разумеется, к табличным гигафлопсам железо NVIDIA может приблизиться только в условиях хорошо оптимизированных приложений GP-GPU, но уж точно не в играх. А в случае архитектуры Ampere тем более оправдан скептический взгляд на отношение теоретических оценок быстродействия к практике. Как ни крути, CUDA-ядра FP32 конкурируют за кеш и такты обслуживающей логики с массой других вычислительных блоков SM, а если речь именно об играх, то сама NVIDIA акцентировала востребованность целочисленных расчетов в шейдерах наряду с FP32, но в этом плане никакого удвоения производительности Ampere не сулит.

Тем не менее преимущество RTX 3070 перед его формальными предшественниками — GeForce RTX 2070 и RTX 2070 SUPER — не подлежит сомнению. NVIDIA утверждает, что при благоприятных условиях (то есть, в играх с трассировкой лучей) новинка обеспечивает на 60% более высокую частоту смены кадров, чем RTX 2070, и это (опять не удержимся от спойлера) близко к истинному положению дел. Кроме того, у RTX 3070 столько же блоков операций растеризации (96), как у TITAN RTX на базе полностью активированного чипа TU102, так что новинка должна хорошо выдерживать нагрузку при рендеринге в высоком разрешении.

Однако при всех достоинствах новой модели у нее есть очевидная слабость — объем оперативной памяти. Да, RTX 3070 обязан быть значительно быстрее RTX 2070 и RTX 2070 SUPER в играх, не говоря уже о рабочих приложениях, но в распоряжении графического процессора остались те же 8 Гбайт VRAM. А если взглянуть на спецификации GeForce RTX 1070/1080, то выяснится, что объем видеопамяти на платах NVIDIA данной рыночной категории остается неизменным уже в течение четырех лет. Положение RTX 3070 смягчает тот факт, что его производительности, скорее всего, недостаточно для современных требовательных игр при разрешении 4К, когда требования к объему VRAM резко увеличиваются, а в режиме 1080p или 1440p объема в 8 Гбайт пока вполне достаточно. Ключевое слово здесь — «пока». Приведем в пример такие устройства, как Radeon R9 390/390X или GeForce GTX 980 Ti, которыми благодаря запасу оперативной памяти в 6–8 Гбайт не стыдно пользоваться до сих пор. Или, напротив, 4-гигабайтные ускорители Radeon R9 Fury (X) и GTX 980 того же периода, которые сошли с дистанции раньше, чем исчерпали ресурс производительности своих графических процессоров.

Как мы уже заметили выше, есть опасение, что RTX 3070 страдает от дефицита не только в объеме, но и в пропускной способности VRAM. Мало того, что RTX 3070 комплектуется обычными микросхемами GDDR6 вместо прогрессивных GDDR6X,  NVIDIA по какой-то причине ограничилась сравнительно медленными чипами с номиналом 14 Гбит/с, хотя даже среди партнерских моделей предыдущего поколения есть образцы видеокарт с памятью GDDR6, рассчитанной на пропускную способность 16 Гбит/с.

ПроизводительNVIDIA
Модель GeForce RTX 2070 GeForce RTX 2080 SUPER GeForce RTX 2080 Ti GeForce RTX 3070 GeForce RTX 3080 GeForce RTX 3090
Графический процессор
Название TU106 TU104 TU102 GA104 GA102 GA102
Микроархитектура Turing Turing Turing Ampere Ampere Ampere
Техпроцесс 12 нм FFN 12 нм FFN 12 нм FFN 8 нм (8N) 8 нм (8N) 8 нм (8N)
Число транзисторов, млн 10 800 13 600 18 600 17 400 28 300 28 300
Тактовая частота, МГц: Base Clock / Boost Clock 1 410/1 620 (Founders Edition: 1 410/1 710) 1 650/1 815 1 350/1 545 (Founders Edition: 1 350/1 635) 1 500 /1 725 1 440 /1 710 1 395 /1 695
Шейдерные ALU 2 304 3 072 4 352 5 888 8 704 10 496
Блоки наложения текстур (TMU) 144 192 272 184 272 328
Блоки операций растеризации (ROP) 64 64 88 96 96 112
Тензорные ядра 288 384 544 184 272 328
RT-ядра 36 48 68 46 68 82
Оперативная память
Разрядность шины, бит 256 256 352 256 320 384
Тип микросхем GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6X SGRAM GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 1 750 (14 000) 1 937,5 (15 500) 1 750 (14 000) 1 750 (14 000) 1 188 (19 000) 1 219 (19 500)
Объем, Мбайт 8 192 8 192 11 264 8 192 10 240 24 576
Шина ввода/вывода PCI Express 3.0×16 PCI Express 3.0×16 PCI Express 3.0×16 PCI Express 4.0×16 PCI Express 4.0×16 PCI Express 4.0×16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 7 465/7 880 (Founders Edition) 11 151 13 448/14 231 (Founders Edition) 20 314 29 768 35 581
Производительность FP64/FP32 1/32 1/32 1/32 1/32 1/32 1/32
Производительность FP16/FP32 2/1 2/1 2/1 1/1 1/1 1/1
Пропускная способность оперативной памяти, Гбайт/с 448 496 616 448 760 936
Вывод изображения
Интерфейсы вывода изображения DL DVI-D, DisplayPort 1.4a, HDMI 2.0b DL DVI-D, DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт 175/185 (Founders Edition) 250 250/260 (Founders Edition) 220 320 350
Розничная цена (США, без налога), $ 499 (рекоменд.)/ 599 (Founders Edition) — в момент выхода 699 (рекоменд. в момент выхода) 999 (рекоменд.)/ 1 199 (Founders Edition) — в момент выхода 499 (рекоменд. в момент выхода) 699 (рекоменд. в момент выхода) 1499 (рекоменд. в момент выхода)
Розничная цена (Россия), руб. 47 990 (Founders Edition в момент выхода) 56 990 (рекоменд. в момент выхода) 95 990 (Founders Edition в момент выхода) 45 490 (nvidia.ru) 63 490 (nvidia.ru) 136 990 (nvidia.ru)

Графические процессоры Ampere выпускаются на мощностях Samsung по современной норме 8 нм, которая обеспечивает даже чуть более высокую плотностью компоновки транзисторов по сравнению с «красными» чипами Navi — их производит 7-нанометровая линия TSMC. Однако новые видеокарты не отличаются рекордной энергоэффективностью, если судить по количеству игровых FPS на ватт. Чтобы достигнуть такого уровня производительности, который демонстрируют GeForce RTX 3080 и RTX 3090, NVIDIA пришлось смириться с громадным ростом потребляемой мощности, и эта тенденция распространяется вниз на GeForce RTX 3070. В то время как RTX 2070 рассчитан на энергопотребление 175 Вт, а RTX 2080 — на 215, новая модель достигла отметки 220 Вт.

Впрочем, такое TBP уже давно перестало быть чем-то из ряда вон выходящим для высокопроизводительной графической карты, так что партнерам NVIDIA будет несложно выпустить собственные модификации GeForce RTX 3070, которые, с одной стороны, могут обойтись дешевле в производстве по сравнению с Founders Edition или наоборот, предложат более высокий оверклокерский потенциал. Партнерские видеокарты на базе GA104 должны появиться в широкой рознице 29 октября, спустя два дня после публикации данного обзора — конечно, при условии, что в этот раз NVIDIA и независимые вендоры лучше подготовились к ажиотажному спросу на свежее железо.

⇡#GeForce RTX 3070 Founders Edition: конструкция

Мы намерены уделить внимание оригинальным версиям GeForce RTX 3070 в ближайшее время, но сегодня рассмотрим новый ускоритель на примере Founders Edition. Как и две старшие модели, парадная разновидность RTX 3070 является ограниченным предложением и поступит в продажу строго по рекомендованной (то есть минимальной) розничной цене $499 или 45 490 руб. В России новинку будет распространять собственный интернет-магазин NVIDIA, и одновременно чипмейкер готовит альтернативную площадку для продаж — пока не знаем, какую именно, но обещают, что она начнет работу в конце текущего месяца.

Как бы то ни было, первых партий Founders Edition точно не хватит на всех желающих, но мы не думаем, что в случае RTX 3070 у покупателей есть повод для недовольства. RTX 3080 и RTX 3090 FE — это своего рода рекламная акция NVIDIA, и других видеокарт с настолько качественной оснасткой вы просто не сможете купить за такие деньги. Хотя следующий Founders Edition также производит впечатление добротно сделанного устройства, он устроен попроще и явно не настолько дорог в производстве.

Тем не менее, и здесь NVIDIA нашла возможность выделиться. Устройство получилось удивительно компактным. Хотя RTX 3070 работает в одном диапазоне мощности с устройствами прошлого поколения на чипе TU104, по габаритам Founders Edition практически не отличается от фирменных модификаций RTX 2060 и RTX 2070, только больше в длину. Напомним, что речь идет об ускорителе с потенциальным быстродействием на уровне GeForce RTX 2080 Ti. Выглядит RTX 3070 столь же презентабельно, как флагманские модели Founders Edition 30-й серии. Периметр системы охлаждения охватывает массивная лента из фрезерованного алюминия, а радиатор больше не закрыт декоративными панелями и красуется на виду. Пожалуй, единственное отличие в эстетике RTX 3070 от RTX 3080 и RTX 3080 — то, что логотип GeForce RTX на борту видеокарты не светится, но для кого-то это как раз очевидный плюс.

Хотя печатная плата RTX 3070 допускает более свободный монтаж компонентов, чем в ускорителях на чипе GA102, располагающих к компактному дизайну PCB, NVIDIA все равно использовала короткую печатную плату для того, чтобы сохранить принцип работы системы охлаждения со сквозным продувом хвостовой части радиатора. Однако из-за этого снова пришлось распаивать разъем дополнительного питания по центру. Для подключения стандартного кабеля от блока питания к двенадцатиконтактной розетке понадобится комплектный переходник, хотя в случае RTX 3070 без него вполне можно было обойтись: видеокарта укладывается по мощности в номинал силовых линий слота PCI Express и одного восьмиконтактного разъема, а для него места уж точно хватило бы.

Радиатор Founders Edition разделен на две секции глухой диагональной перегородкой. Половина ребер, ближайшая к монтажной пластине видеокарты, ориентирована таким образом, чтобы поток воздуха от вентилятора диаметром 85 мм (точно такие же применяются в RTX 3080 FE) шел в перпендикулярном направлении от материнской платы и одновременно наружу из корпуса ПК. В отличие от RTX 3080 и RTX 3090, отверстия решетки по соседству с разъемами видеоинтерфейсов не настолько широкие (там это буквально четыре просторных окошка), и все же решетка препятствует теплообмену намного меньше, чем сеть мелких дырочек у Founders Edition старого образца.

Вторая секция радиатора — так же, как в старших моделях Founders Edition — висит за пределами компактной PCB и продувается собственным вентиляторов насквозь. Только на этот раз стремление уменьшить габариты устройства помешало разместить второй вентилятор с обратной стороны печатной платы. Кроме того, кожух системы охлаждения RTX 3070 устроен так, что часть горячего воздуха идет прямо на материнскую плату рядом со слотом PCI Express, где любят разводить слот M.2 для твердотельных накопителей. Впрочем, точно такой же недостаток есть у открытых кулеров большинства партнерских видеокарт.

Удалив систему охлаждения с печатной платы, мы были несколько разочарованы тем фактом, что в RTX 3070 не используется испарительная камера. Тепло по ребрам радиатора распределяют обычные термотрубки, но, надо отдать должное NVIDIA, медное основание кулера отполировано до зеркального блеска. Да и работает Founders Edition чрезвычайно тихо для своего — уже не экстремально высокого, но по-прежнему значительного — энергопотребления, так что необычная конструкция кулера вновь оправдала себя на все 100%.

GeForce RTX 3070 не требуется усиленное охлаждение обратной стороны печатной платы: все микросхемы памяти сосредоточены вокруг GPU. Тем не менее, NVIDIA не стала экономить на бэкплейте кулера: это металлическая пластина с сиротливой термопрокладкой напротив VRM графического процессора.

⇡#GeForce RTX 3070 Founders Edition: печатная плата

По сравнению с GeForce RTX 3080 и RTX 3090 в конфигурации Founders Edition дизайн печатной платы RTX 3070 изрядно упрощен — в первую очередь из-за того, что здесь применяется обыкновенная память типа GDDR6 вместо более скоростных, но придирчивых к разводке и питанию чипов GDDR6X. Графический процессор GA104 не требует отдельной линии для питания периферийной части кристалла, в которую входят контроллеры VRAM, и вместо двух отдельных регуляторов напряжения, которыми комплектуются любые разновидности старших моделей 30-й серии, довольствуется единственным восьмифазным VRM под управлением ШИМ-контроллера uPI Semiconductor uP9512R. В качестве ключей регулятора используются силовые каскады AOZ5311NQI от Alpha & Omega с номинальным током 50 А.

Оперативная память (микросхемы Samsung K4Z80325BC-HC14 с пропускной способностью 14 Гбит/с на контакт) также обходится простой двухфазной схемой питания. Да и по другим признакам печатная плата стала беднее не только по сравнению с двумя старшими моделями 30-й серии (сделанными с большим запасом надежности по питанию главных компонентов), но даже по сравнению с PCB, которую NVIDIA использовала в продуктах Founders Edition прошлого поколения — включая не только платы для устройств на чипе TU104, но даже RTX 2060 и RTX 2070 на TU106. Так, вместо SMD-конденсаторов фильтры на входе и выходе VRM укомплектованы емкостями сквозного монтажа, которые не отличаются столько же выгодными показателями ESR и ESI. Впрочем, при сравнительно небольшой потребляемой мощности ускорителя (в пределах 230 Вт по результатам наших измерений) более качественные компоненты ему наверняка не требуются. Зато у RTX 3070 Founders Edition отсутствует навязчивый писк катушек индуктивности, от которого страдают флагманские карты.

⇡#Тестовый стенд, методика тестирования

Тестовый стенд
CPU Intel Core i9–9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота)
Материнская плата ASUS MAXIMUS XI APEX
Оперативная память G.Skill Trident Z RGB F4–3200C14D-16GTZR, 2×8 Гбайт (3200 МГц, CL14)
ПЗУ Intel SSD 760p, 1024 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Corsair Hydro Series H115i
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты AMD Radeon Software Adrenalin 2020 Edition 20.9.2
ПО для GPU NVIDIA
NVIDIA GeForce RTX 3070 NVIDIA GeForce Game Ready Driver 456.95
Все видеокарты NVIDIA GeForce Game Ready Driver 456.55
Игры
Игра (в порядке даты выхода) API Метод тестирования Настройки графики Полноэкранное сглаживание
Strange Brigade Vulkan Встроенный бенчмарк Макс. качество графики AA Ultra
Shadow of the Tomb Raider DirectX 12 Встроенный бенчмарк Макс. качество графики. DXR выкл., DLSS выкл. TAA
Assassin’s Creed Odyssey DirectX 11 Встроенный бенчмарк Макс. качество графики AA High (TAA)
Battlefield V DirectX 12 Миссия Liberte + OCAT Макс. качество графики. DXR выкл., DLSS выкл. TAA High
Metro Exodus DirectX 12 Встроенный бенчмарк Макс. качество графики. DXR выкл., DLSS выкл, Shading Rate 100% TAA
Total War: THREE KINGDOMS DirectX 12 Встроенный бенчмарк (Battle Benchmark) Макс. качество графики TAA
Control DirectX 12 OCAT Макс. качество графики TAA
Borderlands 3 DirectX 12 Встроенный бенчмарк Макс. качество графики TAA
Red Dead Redemption 2 Vulkan Встроенный бенчмарк Макс. качество графики TAA High
DOOM Eternal Vulkan Начало миссии Mars Core + OCAT Макс. качество графики TAA
Игры с трассировкой лучей
Игра (в порядке даты выхода) API Метод тестирования Настройки графики Полноэкранное сглаживание
Battlefield V DirectX 12 Миссия Liberté + OCAT Макс. качество графики. DXR Raytrace Reflection Quality: Ultra TAA/DLSS 1.0
Shadow of the Tomb Raider DirectX 12 Встроенный бенчмарк Макс. качество графики. Ray Traced Shadows Quality: Ultra TAA/DLSS 1.0
Metro Exodus DirectX 12 Встроенный бенчмарк Макс. качество графики. Shading Rate 100%. Ray Trace: Ultra TAA/DLSS 1.0
Quake II RTX Vulkan Timedemo, запись demo1.dm2 Макс. качество графики TAA
Control DirectX 12 OCAT Макс. качество графики. Ray Tracing Preset: High TAA/DLSS 2.0 (Quality)
Minecraft with RTX Beta DirectX 12 Бенчмарк в мире Portal Pioneers + OCAT Макс. дальность рендеринга геометрии и частиц Нет/DLSS 2.0

В большинстве тестовых игр показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (или утилита OCAT, если его нет).

Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения. Red Dead Redemption 2 является исключением: ее встроенный бенчмарк регистрирует 1-й процентиль времени рендеринга кадра, из которого выводится соответствующая кадровая частота.

Вычисления общего назначения, кодирование/декодирование видео
Приложение Настройки API
AMD NVIDIA AMD NVIDIA
Adobe Premiere Pro CC 2020 PugetBench for Premiere Pro 0.88 GPU Effects: живое воспроизведение (ProRes 422, 4K@59,94 FPS) OpenCL CUDA
GPU Effects: экспорт в H.264 40 Мбит/с и ProRes 422HQ (4K@59,94 FPS)
Blender 2.9 Демо Class Room с сайта Blender Foundation Рендерер Cycles. Feature Set: Supported. Размер тайла: 256 × 256 OpenCL CUDA/OptX
Демо Nissan GTR от AMD Рендерер AMD Radeon ProRender OpenCL
DXVA Checker 4.1.2, Decode Benchmark H.264 (Microsoft H264 Video Decoder) 1920 × 1080 (High Profile, L4.1); 3840 × 2160 (High Profile, L5.1) D3D11VA
H.265 (Microsoft HEVC Video Extensions) 1920 × 1080 (Main Profile, L4.0); 3840 × 2160 (Main Profile, L5.0); 7680 × 4320 (Main Profile, L6.0)
VP9 (Microsoft VP9 Video Extensions) 1920 × 1080; 3840 × 2160; 7680 × 4320
AV1 (Microsoft AV1 Video Extension)
FFmpeg 4.2.1, кодирование H.264 1920 × 1080 -c: v h264_amf -quality speed -coder cabac -level 4.1 -refs 1 -b: v 3M -c: v h264_nvenc -preset fast -coder cabac -level 4.1 -refs 1 -b: v 3M AMF NVENC
3840 × 2160 -c: v h264_amf -quality speed -coder cabac -level 5.1 -refs 1 -b: v 7.5M -c: v h264_nvenc -preset fast -coder cabac -level 5.1 -refs 1 -b: v 7.5M
FFmpeg 4.2.1, кодирование H.265 1920 × 1080 -c: v hevc_amf -quality speed -level 4 -b: v 3M -c: v hevc_nvenc -preset fast -level 4 -b: v 3M
3840 × 2160 -c: v hevc_amf -quality speed -level 5 -b: v 7.5M -c: v hevc_nvenc -preset fast -level 5 -b: v 7.5M
7680 × 4320 Н/Д -c: v hevc_nvenc -preset fast -level 6 -refs 1 -b: v 20M
REDCINE-X PRO Декодирование файлов RED R3D с разрешением 4К, 6К и 8К OpenCL CUDA

Мощность видеокарт регистрируется отдельно от CPU и прочих компонентов ПК с помощью устройства NVIDIA PCAT. В качестве тестовой нагрузки для тестов мощности и уровня шума используется игра Crysis 3 при разрешении 3840 × 2160 без полноэкранного сглаживания и максимальных параметрах качества графики, а также стресс-тест FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x). Замеры всех параметров выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются.

⇡#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

  • NVIDIA GeForce RTX 3090 FE (1395/1695 МГц, 19,5 Гбит/с, 24 Гбайт);
  • NVIDIA GeForce RTX 3080 FE (1440/1710 МГц, 19 Гбит/с, 10 Гбайт);
  • NVIDIA GeForce RTX 3070 FE (1500/1730 МГц, 14 Гбит/с, 8 Гбайт);
  • NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт);
  • NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт);
  • NVIDIA GeForce RTX 2070 FE (1410/1710 МГц, 14 Гбит/с, 8 Гбайт);
  • NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11 Гбит/с, 11 Гбайт);
  • NVIDIA GeForce GTX 1080 FE (1607/1733 МГц, 10 Гбит/с, 8 Гбайт);
  • AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт);
  • AMD Radeon VII (1400/1750 МГц, 2 Гбит/с, 16 Гбайт).

Прим. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства. Видеокарты с заводским разгоном приведены в соответствие с референсными параметрам (или приближены к последним) при условии, что это можно сделать без ручной правки кривой тактовых частот. В противном случае (ускорители серии NVIDIA GeForce 16, а также GeForce RTX 2070/2080/2080 Ti Founders Edition) используются настройки производителя.

⇡#Тактовые частоты, энергопотребление, температура, уровень шума и разгон

Графический процессор GA104 на плате GeForce RTX 3070 Founders Edition работает в том же частотном диапазоне, что и флагманский чип Ampere в составе RTX 3080 и RTX 3090: под игровой нагрузкой средняя тактовая частота видеоядра стабилизировалась в районе 1919 МГц. По опыту знакомства с партнерскими версиями старших моделей было бы резонно предположить, что эти числа можно проецировать и на высококачественные реализации RTX 3070 с кулерами и печатными платами оригинального дизайна.

Но в данном случае у нас нет уверенности в том, то Founders Edition целиком раскрывает потенциал графического процессора, ведь согласно спецификациям RTX 3070 положены наивысшие тактовые частоты во всей, пока еще до конца не сформированной, линейке GeForce 30, к чему располагает и небольшое по сравнению с GA102 количество транзисторов в кристалле. При этом RTX 3070 Founders Edition получает дополнительное питание через единственный восьмиконтактный разъем (с использованием комплектного переходника) и в штатном режиме упирается в номинал мощности восьмиконтактника (150 Вт) вместе с разъемом PCI Express (75 Вт). Под нагрузкой в играх видеокарта потребляет вплоть до 229 Вт, и судя по замерам в FurMark, уже не располагает неисчерпанным резервом. Вместе с тем налицо значительная экономия мощности по сравнению с GeForce RTX 2080 Ti — ускорителем прошлого поколения, который (как мы успеем убедиться, изучив результаты бенчмарков) действительно является аналогом RTX 3070 по игровому быстродействию. Также стоит обратить внимание на то, что RTX 3070 находится фактически в одной категории потребляемой мощности с Radeon RX 5700 XT (213 Вт у референсной модели), но это лучше характеризует кремний Navi первого поколения, перегретый завышенным напряжением, чем новинку NVIDIA.

Рабочие параметры под нагрузкой (Crysis 3)
Видеокарта Настройки Тактовая частота GPU, МГц Напряжение питания GPU, В Частота вращения вентиляторов, об/мин (% от макс.) Частота вращения вентиляторов 2, об/мин (% от макс.)
Средн. Макс. Средн. Макс. Средн. Средн.
NVIDIA GeForce RTX 3070 FE (1500/1730 МГц, 14 Гбит/с, 8 Гбайт) 1919 1935 1,00 1,01 1767 (50%) 1766 (50%)
NVIDIA GeForce RTX 3070 FE (+50 МГц, 17,2 Гбит/с, 8 Гбайт) +9% мощности 1962 1980 1,00 1,02 1833 (51%) 1832 (51%)
NVIDIA GeForce RTX 3080 FE (1440/1710 МГц, 19 Гбит/с, 10 Гбайт) 1900 1920 1,04 1,06 1747 (49%) 1747 (52%)
NVIDIA GeForce RTX 3090 FE (1395/1695 МГц, 19,5 Гбит/с, 24 Гбайт) 1987 2010 1,04 1,08 1141 (43%) 1141 (43%)
NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11000 Мбит/с, 11 Гбайт) 1735 1810 0,96 1,01 2377 (50%) Н/Д
NVIDIA GeForce RTX 2070 FE (1410/1710 МГц, 14 Гбит/с, 8 Гбайт) 1812 1845 0,98 1,00 1999 (54%) 1999 (54%)
NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) 1907 1920 1,03 1,04 1969 (53%) 1969 (53%)
NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) 1723 1860 0,91 1,03 2082 (56%) 2082 (56%)
AMD Radeon VII (1800 МГц, 2000 Мбит/с, 16 Гбайт) 1756 1786 Н/Д Н/Д 2617 (Н/Д) Н/Д
AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт) Термопаста ARCTIC MX-2 вместо графитовой прокладки 1795 1819 1,07 1,18 2102 (43%) Н/Д

Прим. Измерение всех параметров выполняется после прогрева GPU и стабилизации тактовых частот.

Действительно, на эффективном оверклокинге графического процессора GeForce RTX 3070 Founders Edition можно поставить крест. BIOS видеокарты позволяет увеличить TBP всего лишь на 9%, а попытки разгона GPU не прибавили больше 50 МГц к номинальной тактовой частоте и 42 МГц к реальной частоте под нагрузкой. Порадовала только оперативная память: стартуя со штатной пропускной способности 14 Гбит/с, микросхемы GDDR6 покорили отметку 17,2 Гбит/с. А ведь наш экземпляр Founders Edition комплектуется чипами GDDR6 точно такого же номинала, как предполагают спецификации видеокарты. Складывается впечатление, будто второму по 

Полный текст статьи читайте на 3DNews