Обзор видеокарты NVIDIA GeForce RTX 3070 Founders Edition: убийца королей
Сегодня мы продолжим знакомство с игровыми видеокартами нового поколения на «зеленых» чипах Ampere, но это знакомство — в полном соответствии с требованиями карантина — остается дистанционным для большинства наших читателей. Многие уже наверняка готовы к апгрейду, не дожидаясь, чем ответит AMD на дебют ускорителей NVIDIA 30-й серии, однако GeForce RTX 3080 и RTX 3090 по-прежнему трудно купить в российской рознице за более-менее приемлемую сумму, а самые заманчивые по соотношению цена-качество модификации Founders Edition все еще недоступны на сайте чипмейкера даже по предзаказу.
Будем надеяться, что выход GeForce RTX 3070 изменит ситуацию к лучшему. Ведь это, в отличие от двух старших моделей, по-настоящему массовый продукт. Да, RTX 3080 и RTX 3090 подняли планку быстродействия ускорителей NVIDIA и несмотря на завышенные розничные цены сумели взбодрить траекторию роста FPS на доллар, приунывшую со времен GeForce 10-й серии. Однако для основной массы геймеров флагманские видеокарты представляют чисто теоретический интерес и повод для дискуссий в комментариях к обзорам. GeForce RTX 3070 гораздо ближе к народу, тем более что эта модель в серии осенних релизов NVIDIA лучше всего иллюстрирует разворот ценовой политики чипмейкера.
Дело в том, что RTX 3070 сулит игровую производительность на уровне GeForce RTX 2080 Ti — самой переоцененной модели 20-й серии, которая стоила не меньше $999 ($1199 за Founders Edition) — по стоимости RTX 2070, то есть всего $499. Можно сколько угодно рассуждать о том, как прогрессировали возможности GPU по сравнению с прошлым поколением, но 50-процентная скидка на доступ к прежде флагманскому уровню быстродействия выглядит убедительнее всего. Конечно, при условии, что ожидания не разойдутся с действительностью, но именно это мы намерены выяснить в обзоре новинки.
⇡#Графический процессор GA104
Главное, что отличает семейство ускорителей 30-й серии от предыдущего поколения и что в конечном счете стало одной из причин ударного роста производительности, это новая сегментация модельного ряда. Согласно ей устройство на 80-й позиции комплектуется флагманским GPU (GA102, пусть и урезанным в составе GeForce RTX 3080), а 70-й модели достался чип второго эшелона GA104. Линейка GeForce 20 была устроена совершенно по-другому: RTX 2080 основан на графическом процессоре TU104, а базовая версия RTX 2070 — на TU106. Таким образом, две ключевые модели 30-й серии опираются на более мощную кремниевую базу в рамках своего поколения, чем их формальные предшественники.
Мы уже прекрасно знаем, к чему это привело в случае GeForce RTX 3080: NVIDIA вернулась к темпам роста производительности, которых мы не видели со времен прорывной для своего времени архитектуры Maxwell. Примерно то же самое произошло с RTX 3070: новинка пришла на замену базовой версии RTX 2070, но с технической, а не ценовой точки зрения ее непосредственным предшественником является GeForce RTX 2080, а также RTX 2070 SUPER на чипе TU104. Так что сравнение графического процессора GA104 и кристаллов прошлого поколения следует начинать именно с TU104.
Производитель | NVIDIA | |||
---|---|---|---|---|
Название | TU104 | TU102 | GA104 | GA102 |
Где используется | GeForce RTX 2070 SUPER, RTX 2080, RTX 2080 SUPER | GeForce RTX 2080 Ti, TITAN RTX | GeForce RTX 3070 | GeForce RTX 3080, RTX 3090 |
Микроархитектура | Turing | Turing | Ampere | Ampere |
Техпроцесс, нм | 12 нм FFN | 12 нм FFN | 8 нм (8N) | 8 нм (8N) |
Число транзисторов, млн | 13 600 | 18 600 | 17 400 | 28 300 |
Площадь чипа, мм2 | 545 | 754 | 392,5 | 628 |
Число SM/TPC/GPC | ||||
Streaming Multiprocessors (SM) | 48 | 72 | 48 | 84 |
Thread Processing Clusters (TPC) | 24 | 36 | 24 | 42 |
Graphics Processing Clusters (GPC) | 6 | 6 | 6 | 7 |
Конфигурация потокового мультипроцессора (SM) | ||||
CUDA-ядра FP16 | Нет | Нет | Нет | Нет |
CUDA-ядра FP32 | 4 × 16 | 4 × 16 | 4 × 32 | 4 × 32 |
CUDA-ядра FP64 | 2 | 2 | 2 | 2 |
CUDA-ядра INT32 | 4 × 16 | 4 × 16 | 4 × 16 | 4 × 16 |
ALU специального назначения (SFU) | 4 × 4 | 4 × 4 | 4 × 4 | 4 × 4 |
Тензорные ядра | 4 × 2 | 4 × 2 | 4 × 1 | 4 × 1 |
RT-ядра | 1 | 1 | 1 | 1 |
Блоки наложения текстур (TMU) | 4 | 4 | 4 | 4 |
Объем регистрового файла, Кбайт | 256 | 256 | 256 | 256 |
Объем кеша L1, Кбайт | 32/64 из 96 (общий с разделяемой памятью) | 32/64 из 96 (общий с разделяемой памятью) | До 64 из 128 (общий с разделяемой памятью) | До 64 из 128 (общий с разделяемой памятью) |
Объем разделяемой памяти, Кбайт | 32/64 из 96 (общий с кешем L1) | 32/64 из 96 (общий с кешем L1) | До 100 из 128 (общий с кешем L1) | До 100 из 128 (общий с кешем L1) |
Программируемые вычислительные блоки GPU | ||||
CUDA-ядра FP16 | Нет | Нет | Нет | Нет |
CUDA-ядра FP32 | 3 072 | 4 608 | 6 144 | 10 752 |
CUDA-ядра FP64 | 96 | 144 | 96 | 168 |
CUDA-ядра INT32 | 3 072 | 4 608 | 3 072 | 5 376 |
ALU специального назначения (SFU) | 768 | 1 152 | 768 | 1 344 |
Тензорные ядра | 384 | 576 | 192 | 336 |
RT-ядра | 48 | 72 | 48 | 84 |
Блоки GPU фиксированной функциональности | ||||
Блоки наложения текстур (TMU) | 192 | 288 | 192 | 336 |
Блоки операций растеризации (ROP) | 64 | 96 | 92 | 112 |
Конфигурация памяти | ||||
Объем кеша L2, Кбайт | 4 096 | 6 144 | 4 096 | 6 144 |
Разрядность шины RAM, бит | 256 | 384 | 256 | 384 |
Тип микросхем RAM | GDDR6 | GDDR6 | GDDR6 / (GDDR6X?) SGRAM | GDDR6/GDDR6X SGRAM |
Интерфейс NVLINK | 1 × NVLink 2.0×8 | 2 × NVLink 2.0×8 | Нет | 4 × NVLink 3.0×4 |
Интерфейс PCI Express | 3.0×16 | 3.0×16 | 3.0×16 | 3.0×16 |
Макроархитектура старого и нового чипов имеет много общих черт. Оба графических ядра содержат по шесть блоков GPC (Graphics Processing Cluster, крупнейших масштабируемых компонентов в логике «зеленых» GPU) и в общей сложности по 48 потоковых мультипроцессоров (SM). При этом массив 32-битных CUDA-ядер, обрабатывающих вещественные числа, внутри потокового мультипроцессора SM удвоен по сравнению с Turing. Таким образом, при неизменном количестве SM теоретическая производительность GPU на такт в операциях над 32-битными вещественными числами стала в два раза выше, чем прежде: у TU104 в общей сложности 3 072 FP32-совместимых CUDA-ядра, а у GA104 — целых 6 144.
При этом транзисторный бюджет GPU, разумеется, распух, но не так сильно, как если бы NVIDIA просто увеличила количество SM или GPC на кристалле, сохранив организацию компонентов, присущую Turing. GA104 и так приближается по числу транзисторов к уходящему на пенсию GPU первого эшелона. Количество целочисленных ALU внутри SM осталось прежним, равно как и пропускная способность планировщиков. О реальном быстродействии, близком к проектным значениям Ampere, может идти речь только при исключительно вещественночисленной нагрузке, однако как в играх, так и в массе рабочих приложений, новый подход, принятый инженерами NVIDIA, уже доказал свою эффективность.
Пожалуй, удвоенное число CUDA-ядер FP32 внутри потокового мультипроцессора — главное, что нужно знать об архитектуре новых GPU. В отличие от Turing, Ampere ориентирован не на инновационные технологии, а сугубо на рост производительности. Конечно, здесь не обошлось без оптимизаций различного рода, которые относятся к парадным функциям графических процессоров NVIDIA — трассировке лучей и машинному обучению. Так, GA104 не превосходит TU104 по числу RT-ядер и содержит вдвое меньше тензорных блоков. Но Ampere более эффективно выполняет рейтрейсинг (причем оптимизации относятся и к прохождению структур BVH специализированной логикой, и, потенциально, к общему быстродействию трассированных эффектов в рамках гибридного рендеринга), а производительность тензорных блоков удвоилась, что позволило сэкономить на их количестве.
Для того, чтобы сформировать исчерпывающее представление о возможностях кремния Ampere, рекомендуем нашу аналитическую статью. Заострим внимание лишь на еще одной особенности, хорошо заметной в спецификациях GA104. Блоки операций растеризации (ROP) Ampere больше не привязаны к контроллерам оперативной памяти и стали компонентами GPC. Таким образом NVIDIA привела в соответствие между собой пропускную способность начальной и конечной стадий конвейера рендеринга. Растеризатор внутри GPC выдает 16 цветных пикселов за такт, а каждый ROP смешивает или закрашивает один пиксел. Теперь, когда GPC содержит 16 ROP, установилось соотношение 1:1 между пропускной способностью растеризаторов и блоков растровых операций, не зависящее от конфигурации шины памяти. Поэтому несмотря на то, что GA104 и TU104 сообщаются с VRAM 256-битной шиной, общее количество ROP на чипе нового поколение в полтора раза выше — 96 против 64, — что положительно сказывается на производительности в режиме высокого разрешения.
Однако нужно поставить вопрос, удовлетворяет ли пропускная способность 256-битной шины памяти требованиям мощного графического ядра GA104. Старший кремний, GA102, сохранил 384-битную шину VRAM, которой пользуется флагманский чип семейства Turing, но GeForce RTX 3080 и RTX 3090 вышли из положения благодаря скоростной памяти GDDR6X. RTX 3070 является экономным предложением по сравнению со старшими моделями 30-й серии и, как следствие, лишен подобной роскоши. Пока даже не знаем, существует ли в принципе техническая возможность комбинировать GA104 с чипами GDDR6X, которой NVIDIA могла бы воспользоваться в будущем, чтобы выпустить видеокарту под маркой RTX 3070 Ti или 3070 SUPER.
Технические характеристики
GeForce RTX 3070 основан на частично урезанном кристалле GA104, но потери быстродействия в данном случае совершенно незначительны: кристалл лишился всего двух SM и, соответственно, 256 FP32-совместимых шейдерных ALU. Сделано это скорее для того, чтобы увеличить количество пригодных к эксплуатации чипов, нежели для сегментации модельного ряда ускорителей. Как бы то ни было, при тактовых частотах GPU, обозначенных в спецификациях, удвоенный набор вещественночисленных CUDA-ядер внутри SM архитектуры Ampere позволяет RTX 3070 претендовать на уровень быстродействия, недоступный даже флагманской модели прошлого поколения, не говоря уже об RTX 2070 или RTX 2070 SUPER. Разумеется, к табличным гигафлопсам железо NVIDIA может приблизиться только в условиях хорошо оптимизированных приложений GP-GPU, но уж точно не в играх. А в случае архитектуры Ampere тем более оправдан скептический взгляд на отношение теоретических оценок быстродействия к практике. Как ни крути, CUDA-ядра FP32 конкурируют за кеш и такты обслуживающей логики с массой других вычислительных блоков SM, а если речь именно об играх, то сама NVIDIA акцентировала востребованность целочисленных расчетов в шейдерах наряду с FP32, но в этом плане никакого удвоения производительности Ampere не сулит.
Тем не менее преимущество RTX 3070 перед его формальными предшественниками — GeForce RTX 2070 и RTX 2070 SUPER — не подлежит сомнению. NVIDIA утверждает, что при благоприятных условиях (то есть, в играх с трассировкой лучей) новинка обеспечивает на 60% более высокую частоту смены кадров, чем RTX 2070, и это (опять не удержимся от спойлера) близко к истинному положению дел. Кроме того, у RTX 3070 столько же блоков операций растеризации (96), как у TITAN RTX на базе полностью активированного чипа TU102, так что новинка должна хорошо выдерживать нагрузку при рендеринге в высоком разрешении.
Однако при всех достоинствах новой модели у нее есть очевидная слабость — объем оперативной памяти. Да, RTX 3070 обязан быть значительно быстрее RTX 2070 и RTX 2070 SUPER в играх, не говоря уже о рабочих приложениях, но в распоряжении графического процессора остались те же 8 Гбайт VRAM. А если взглянуть на спецификации GeForce RTX 1070/1080, то выяснится, что объем видеопамяти на платах NVIDIA данной рыночной категории остается неизменным уже в течение четырех лет. Положение RTX 3070 смягчает тот факт, что его производительности, скорее всего, недостаточно для современных требовательных игр при разрешении 4К, когда требования к объему VRAM резко увеличиваются, а в режиме 1080p или 1440p объема в 8 Гбайт пока вполне достаточно. Ключевое слово здесь — «пока». Приведем в пример такие устройства, как Radeon R9 390/390X или GeForce GTX 980 Ti, которыми благодаря запасу оперативной памяти в 6–8 Гбайт не стыдно пользоваться до сих пор. Или, напротив, 4-гигабайтные ускорители Radeon R9 Fury (X) и GTX 980 того же периода, которые сошли с дистанции раньше, чем исчерпали ресурс производительности своих графических процессоров.
Как мы уже заметили выше, есть опасение, что RTX 3070 страдает от дефицита не только в объеме, но и в пропускной способности VRAM. Мало того, что RTX 3070 комплектуется обычными микросхемами GDDR6 вместо прогрессивных GDDR6X, NVIDIA по какой-то причине ограничилась сравнительно медленными чипами с номиналом 14 Гбит/с, хотя даже среди партнерских моделей предыдущего поколения есть образцы видеокарт с памятью GDDR6, рассчитанной на пропускную способность 16 Гбит/с.
Производитель | NVIDIA | |||||
---|---|---|---|---|---|---|
Модель | GeForce RTX 2070 | GeForce RTX 2080 SUPER | GeForce RTX 2080 Ti | GeForce RTX 3070 | GeForce RTX 3080 | GeForce RTX 3090 |
Графический процессор | ||||||
Название | TU106 | TU104 | TU102 | GA104 | GA102 | GA102 |
Микроархитектура | Turing | Turing | Turing | Ampere | Ampere | Ampere |
Техпроцесс | 12 нм FFN | 12 нм FFN | 12 нм FFN | 8 нм (8N) | 8 нм (8N) | 8 нм (8N) |
Число транзисторов, млн | 10 800 | 13 600 | 18 600 | 17 400 | 28 300 | 28 300 |
Тактовая частота, МГц: Base Clock / Boost Clock | 1 410/1 620 (Founders Edition: 1 410/1 710) | 1 650/1 815 | 1 350/1 545 (Founders Edition: 1 350/1 635) | 1 500 /1 725 | 1 440 /1 710 | 1 395 /1 695 |
Шейдерные ALU | 2 304 | 3 072 | 4 352 | 5 888 | 8 704 | 10 496 |
Блоки наложения текстур (TMU) | 144 | 192 | 272 | 184 | 272 | 328 |
Блоки операций растеризации (ROP) | 64 | 64 | 88 | 96 | 96 | 112 |
Тензорные ядра | 288 | 384 | 544 | 184 | 272 | 328 |
RT-ядра | 36 | 48 | 68 | 46 | 68 | 82 |
Оперативная память | ||||||
Разрядность шины, бит | 256 | 256 | 352 | 256 | 320 | 384 |
Тип микросхем | GDDR6 SGRAM | GDDR6 SGRAM | GDDR6 SGRAM | GDDR6 SGRAM | GDDR6X SGRAM | GDDR6X SGRAM |
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) | 1 750 (14 000) | 1 937,5 (15 500) | 1 750 (14 000) | 1 750 (14 000) | 1 188 (19 000) | 1 219 (19 500) |
Объем, Мбайт | 8 192 | 8 192 | 11 264 | 8 192 | 10 240 | 24 576 |
Шина ввода/вывода | PCI Express 3.0×16 | PCI Express 3.0×16 | PCI Express 3.0×16 | PCI Express 4.0×16 | PCI Express 4.0×16 | PCI Express 4.0×16 |
Производительность | ||||||
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) | 7 465/7 880 (Founders Edition) | 11 151 | 13 448/14 231 (Founders Edition) | 20 314 | 29 768 | 35 581 |
Производительность FP64/FP32 | 1/32 | 1/32 | 1/32 | 1/32 | 1/32 | 1/32 |
Производительность FP16/FP32 | 2/1 | 2/1 | 2/1 | 1/1 | 1/1 | 1/1 |
Пропускная способность оперативной памяти, Гбайт/с | 448 | 496 | 616 | 448 | 760 | 936 |
Вывод изображения | ||||||
Интерфейсы вывода изображения | DL DVI-D, DisplayPort 1.4a, HDMI 2.0b | DL DVI-D, DisplayPort 1.4a, HDMI 2.0b | DisplayPort 1.4a, HDMI 2.0b | DisplayPort 1.4a, HDMI 2.1 | DisplayPort 1.4a, HDMI 2.1 | DisplayPort 1.4a, HDMI 2.1 |
TBP/TDP, Вт | 175/185 (Founders Edition) | 250 | 250/260 (Founders Edition) | 220 | 320 | 350 |
Розничная цена (США, без налога), $ | 499 (рекоменд.)/ 599 (Founders Edition) — в момент выхода | 699 (рекоменд. в момент выхода) | 999 (рекоменд.)/ 1 199 (Founders Edition) — в момент выхода | 499 (рекоменд. в момент выхода) | 699 (рекоменд. в момент выхода) | 1499 (рекоменд. в момент выхода) |
Розничная цена (Россия), руб. | 47 990 (Founders Edition в момент выхода) | 56 990 (рекоменд. в момент выхода) | 95 990 (Founders Edition в момент выхода) | 45 490 (nvidia.ru) | 63 490 (nvidia.ru) | 136 990 (nvidia.ru) |
Графические процессоры Ampere выпускаются на мощностях Samsung по современной норме 8 нм, которая обеспечивает даже чуть более высокую плотностью компоновки транзисторов по сравнению с «красными» чипами Navi — их производит 7-нанометровая линия TSMC. Однако новые видеокарты не отличаются рекордной энергоэффективностью, если судить по количеству игровых FPS на ватт. Чтобы достигнуть такого уровня производительности, который демонстрируют GeForce RTX 3080 и RTX 3090, NVIDIA пришлось смириться с громадным ростом потребляемой мощности, и эта тенденция распространяется вниз на GeForce RTX 3070. В то время как RTX 2070 рассчитан на энергопотребление 175 Вт, а RTX 2080 — на 215, новая модель достигла отметки 220 Вт.
Впрочем, такое TBP уже давно перестало быть чем-то из ряда вон выходящим для высокопроизводительной графической карты, так что партнерам NVIDIA будет несложно выпустить собственные модификации GeForce RTX 3070, которые, с одной стороны, могут обойтись дешевле в производстве по сравнению с Founders Edition или наоборот, предложат более высокий оверклокерский потенциал. Партнерские видеокарты на базе GA104 должны появиться в широкой рознице 29 октября, спустя два дня после публикации данного обзора — конечно, при условии, что в этот раз NVIDIA и независимые вендоры лучше подготовились к ажиотажному спросу на свежее железо.
⇡#GeForce RTX 3070 Founders Edition: конструкция
Мы намерены уделить внимание оригинальным версиям GeForce RTX 3070 в ближайшее время, но сегодня рассмотрим новый ускоритель на примере Founders Edition. Как и две старшие модели, парадная разновидность RTX 3070 является ограниченным предложением и поступит в продажу строго по рекомендованной (то есть минимальной) розничной цене $499 или 45 490 руб. В России новинку будет распространять собственный интернет-магазин NVIDIA, и одновременно чипмейкер готовит альтернативную площадку для продаж — пока не знаем, какую именно, но обещают, что она начнет работу в конце текущего месяца.
Как бы то ни было, первых партий Founders Edition точно не хватит на всех желающих, но мы не думаем, что в случае RTX 3070 у покупателей есть повод для недовольства. RTX 3080 и RTX 3090 FE — это своего рода рекламная акция NVIDIA, и других видеокарт с настолько качественной оснасткой вы просто не сможете купить за такие деньги. Хотя следующий Founders Edition также производит впечатление добротно сделанного устройства, он устроен попроще и явно не настолько дорог в производстве.
Тем не менее, и здесь NVIDIA нашла возможность выделиться. Устройство получилось удивительно компактным. Хотя RTX 3070 работает в одном диапазоне мощности с устройствами прошлого поколения на чипе TU104, по габаритам Founders Edition практически не отличается от фирменных модификаций RTX 2060 и RTX 2070, только больше в длину. Напомним, что речь идет об ускорителе с потенциальным быстродействием на уровне GeForce RTX 2080 Ti. Выглядит RTX 3070 столь же презентабельно, как флагманские модели Founders Edition 30-й серии. Периметр системы охлаждения охватывает массивная лента из фрезерованного алюминия, а радиатор больше не закрыт декоративными панелями и красуется на виду. Пожалуй, единственное отличие в эстетике RTX 3070 от RTX 3080 и RTX 3080 — то, что логотип GeForce RTX на борту видеокарты не светится, но для кого-то это как раз очевидный плюс.
Хотя печатная плата RTX 3070 допускает более свободный монтаж компонентов, чем в ускорителях на чипе GA102, располагающих к компактному дизайну PCB, NVIDIA все равно использовала короткую печатную плату для того, чтобы сохранить принцип работы системы охлаждения со сквозным продувом хвостовой части радиатора. Однако из-за этого снова пришлось распаивать разъем дополнительного питания по центру. Для подключения стандартного кабеля от блока питания к двенадцатиконтактной розетке понадобится комплектный переходник, хотя в случае RTX 3070 без него вполне можно было обойтись: видеокарта укладывается по мощности в номинал силовых линий слота PCI Express и одного восьмиконтактного разъема, а для него места уж точно хватило бы.
Радиатор Founders Edition разделен на две секции глухой диагональной перегородкой. Половина ребер, ближайшая к монтажной пластине видеокарты, ориентирована таким образом, чтобы поток воздуха от вентилятора диаметром 85 мм (точно такие же применяются в RTX 3080 FE) шел в перпендикулярном направлении от материнской платы и одновременно наружу из корпуса ПК. В отличие от RTX 3080 и RTX 3090, отверстия решетки по соседству с разъемами видеоинтерфейсов не настолько широкие (там это буквально четыре просторных окошка), и все же решетка препятствует теплообмену намного меньше, чем сеть мелких дырочек у Founders Edition старого образца.
Вторая секция радиатора — так же, как в старших моделях Founders Edition — висит за пределами компактной PCB и продувается собственным вентиляторов насквозь. Только на этот раз стремление уменьшить габариты устройства помешало разместить второй вентилятор с обратной стороны печатной платы. Кроме того, кожух системы охлаждения RTX 3070 устроен так, что часть горячего воздуха идет прямо на материнскую плату рядом со слотом PCI Express, где любят разводить слот M.2 для твердотельных накопителей. Впрочем, точно такой же недостаток есть у открытых кулеров большинства партнерских видеокарт.
Удалив систему охлаждения с печатной платы, мы были несколько разочарованы тем фактом, что в RTX 3070 не используется испарительная камера. Тепло по ребрам радиатора распределяют обычные термотрубки, но, надо отдать должное NVIDIA, медное основание кулера отполировано до зеркального блеска. Да и работает Founders Edition чрезвычайно тихо для своего — уже не экстремально высокого, но по-прежнему значительного — энергопотребления, так что необычная конструкция кулера вновь оправдала себя на все 100%.
GeForce RTX 3070 не требуется усиленное охлаждение обратной стороны печатной платы: все микросхемы памяти сосредоточены вокруг GPU. Тем не менее, NVIDIA не стала экономить на бэкплейте кулера: это металлическая пластина с сиротливой термопрокладкой напротив VRM графического процессора.
⇡#GeForce RTX 3070 Founders Edition: печатная плата
По сравнению с GeForce RTX 3080 и RTX 3090 в конфигурации Founders Edition дизайн печатной платы RTX 3070 изрядно упрощен — в первую очередь из-за того, что здесь применяется обыкновенная память типа GDDR6 вместо более скоростных, но придирчивых к разводке и питанию чипов GDDR6X. Графический процессор GA104 не требует отдельной линии для питания периферийной части кристалла, в которую входят контроллеры VRAM, и вместо двух отдельных регуляторов напряжения, которыми комплектуются любые разновидности старших моделей 30-й серии, довольствуется единственным восьмифазным VRM под управлением ШИМ-контроллера uPI Semiconductor uP9512R. В качестве ключей регулятора используются силовые каскады AOZ5311NQI от Alpha & Omega с номинальным током 50 А.
Оперативная память (микросхемы Samsung K4Z80325BC-HC14 с пропускной способностью 14 Гбит/с на контакт) также обходится простой двухфазной схемой питания. Да и по другим признакам печатная плата стала беднее не только по сравнению с двумя старшими моделями 30-й серии (сделанными с большим запасом надежности по питанию главных компонентов), но даже по сравнению с PCB, которую NVIDIA использовала в продуктах Founders Edition прошлого поколения — включая не только платы для устройств на чипе TU104, но даже RTX 2060 и RTX 2070 на TU106. Так, вместо SMD-конденсаторов фильтры на входе и выходе VRM укомплектованы емкостями сквозного монтажа, которые не отличаются столько же выгодными показателями ESR и ESI. Впрочем, при сравнительно небольшой потребляемой мощности ускорителя (в пределах 230 Вт по результатам наших измерений) более качественные компоненты ему наверняка не требуются. Зато у RTX 3070 Founders Edition отсутствует навязчивый писк катушек индуктивности, от которого страдают флагманские карты.
⇡#Тестовый стенд, методика тестирования
Тестовый стенд | |
---|---|
CPU | Intel Core i9–9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота) |
Материнская плата | ASUS MAXIMUS XI APEX |
Оперативная память | G.Skill Trident Z RGB F4–3200C14D-16GTZR, 2×8 Гбайт (3200 МГц, CL14) |
ПЗУ | Intel SSD 760p, 1024 Гбайт |
Блок питания | Corsair AX1200i, 1200 Вт |
Система охлаждения CPU | Corsair Hydro Series H115i |
Корпус | CoolerMaster Test Bench V1.0 |
Монитор | NEC EA244UHD |
Операционная система | Windows 10 Pro x64 |
ПО для GPU AMD | |
Все видеокарты | AMD Radeon Software Adrenalin 2020 Edition 20.9.2 |
ПО для GPU NVIDIA | |
NVIDIA GeForce RTX 3070 | NVIDIA GeForce Game Ready Driver 456.95 |
Все видеокарты | NVIDIA GeForce Game Ready Driver 456.55 |
Игры | ||||
---|---|---|---|---|
Игра (в порядке даты выхода) | API | Метод тестирования | Настройки графики | Полноэкранное сглаживание |
Strange Brigade | Vulkan | Встроенный бенчмарк | Макс. качество графики | AA Ultra |
Shadow of the Tomb Raider | DirectX 12 | Встроенный бенчмарк | Макс. качество графики. DXR выкл., DLSS выкл. | TAA |
Assassin’s Creed Odyssey | DirectX 11 | Встроенный бенчмарк | Макс. качество графики | AA High (TAA) |
Battlefield V | DirectX 12 | Миссия Liberte + OCAT | Макс. качество графики. DXR выкл., DLSS выкл. | TAA High |
Metro Exodus | DirectX 12 | Встроенный бенчмарк | Макс. качество графики. DXR выкл., DLSS выкл, Shading Rate 100% | TAA |
Total War: THREE KINGDOMS | DirectX 12 | Встроенный бенчмарк (Battle Benchmark) | Макс. качество графики | TAA |
Control | DirectX 12 | OCAT | Макс. качество графики | TAA |
Borderlands 3 | DirectX 12 | Встроенный бенчмарк | Макс. качество графики | TAA |
Red Dead Redemption 2 | Vulkan | Встроенный бенчмарк | Макс. качество графики | TAA High |
DOOM Eternal | Vulkan | Начало миссии Mars Core + OCAT | Макс. качество графики | TAA |
Игры с трассировкой лучей | ||||
---|---|---|---|---|
Игра (в порядке даты выхода) | API | Метод тестирования | Настройки графики | Полноэкранное сглаживание |
Battlefield V | DirectX 12 | Миссия Liberté + OCAT | Макс. качество графики. DXR Raytrace Reflection Quality: Ultra | TAA/DLSS 1.0 |
Shadow of the Tomb Raider | DirectX 12 | Встроенный бенчмарк | Макс. качество графики. Ray Traced Shadows Quality: Ultra | TAA/DLSS 1.0 |
Metro Exodus | DirectX 12 | Встроенный бенчмарк | Макс. качество графики. Shading Rate 100%. Ray Trace: Ultra | TAA/DLSS 1.0 |
Quake II RTX | Vulkan | Timedemo, запись demo1.dm2 | Макс. качество графики | TAA |
Control | DirectX 12 | OCAT | Макс. качество графики. Ray Tracing Preset: High | TAA/DLSS 2.0 (Quality) |
Minecraft with RTX Beta | DirectX 12 | Бенчмарк в мире Portal Pioneers + OCAT | Макс. дальность рендеринга геометрии и частиц | Нет/DLSS 2.0 |
В большинстве тестовых игр показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (или утилита OCAT, если его нет).
Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения. Red Dead Redemption 2 является исключением: ее встроенный бенчмарк регистрирует 1-й процентиль времени рендеринга кадра, из которого выводится соответствующая кадровая частота.
Вычисления общего назначения, кодирование/декодирование видео | |||||
---|---|---|---|---|---|
Приложение | Настройки | API | |||
AMD | NVIDIA | AMD | NVIDIA | ||
Adobe Premiere Pro CC 2020 | PugetBench for Premiere Pro 0.88 | GPU Effects: живое воспроизведение (ProRes 422, 4K@59,94 FPS) | OpenCL | CUDA | |
GPU Effects: экспорт в H.264 40 Мбит/с и ProRes 422HQ (4K@59,94 FPS) | |||||
Blender 2.9 | Демо Class Room с сайта Blender Foundation | Рендерер Cycles. Feature Set: Supported. Размер тайла: 256 × 256 | OpenCL | CUDA/OptX | |
Демо Nissan GTR от AMD | Рендерер AMD Radeon ProRender | OpenCL | |||
DXVA Checker 4.1.2, Decode Benchmark | H.264 (Microsoft H264 Video Decoder) | 1920 × 1080 (High Profile, L4.1); 3840 × 2160 (High Profile, L5.1) | D3D11VA | ||
H.265 (Microsoft HEVC Video Extensions) | 1920 × 1080 (Main Profile, L4.0); 3840 × 2160 (Main Profile, L5.0); 7680 × 4320 (Main Profile, L6.0) | ||||
VP9 (Microsoft VP9 Video Extensions) | 1920 × 1080; 3840 × 2160; 7680 × 4320 | ||||
AV1 (Microsoft AV1 Video Extension) | |||||
FFmpeg 4.2.1, кодирование H.264 | 1920 × 1080 | -c: v h264_amf -quality speed -coder cabac -level 4.1 -refs 1 -b: v 3M | -c: v h264_nvenc -preset fast -coder cabac -level 4.1 -refs 1 -b: v 3M | AMF | NVENC |
3840 × 2160 | -c: v h264_amf -quality speed -coder cabac -level 5.1 -refs 1 -b: v 7.5M | -c: v h264_nvenc -preset fast -coder cabac -level 5.1 -refs 1 -b: v 7.5M | |||
FFmpeg 4.2.1, кодирование H.265 | 1920 × 1080 | -c: v hevc_amf -quality speed -level 4 -b: v 3M | -c: v hevc_nvenc -preset fast -level 4 -b: v 3M | ||
3840 × 2160 | -c: v hevc_amf -quality speed -level 5 -b: v 7.5M | -c: v hevc_nvenc -preset fast -level 5 -b: v 7.5M | |||
7680 × 4320 | Н/Д | -c: v hevc_nvenc -preset fast -level 6 -refs 1 -b: v 20M | |||
REDCINE-X PRO | Декодирование файлов RED R3D с разрешением 4К, 6К и 8К | — | — | OpenCL | CUDA |
Мощность видеокарт регистрируется отдельно от CPU и прочих компонентов ПК с помощью устройства NVIDIA PCAT. В качестве тестовой нагрузки для тестов мощности и уровня шума используется игра Crysis 3 при разрешении 3840 × 2160 без полноэкранного сглаживания и максимальных параметрах качества графики, а также стресс-тест FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x). Замеры всех параметров выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются.
⇡#Участники тестирования
В тестировании производительности приняли участие следующие видеокарты:
- NVIDIA GeForce RTX 3090 FE (1395/1695 МГц, 19,5 Гбит/с, 24 Гбайт);
- NVIDIA GeForce RTX 3080 FE (1440/1710 МГц, 19 Гбит/с, 10 Гбайт);
- NVIDIA GeForce RTX 3070 FE (1500/1730 МГц, 14 Гбит/с, 8 Гбайт);
- NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт);
- NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт);
- NVIDIA GeForce RTX 2070 FE (1410/1710 МГц, 14 Гбит/с, 8 Гбайт);
- NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11 Гбит/с, 11 Гбайт);
- NVIDIA GeForce GTX 1080 FE (1607/1733 МГц, 10 Гбит/с, 8 Гбайт);
- AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт);
- AMD Radeon VII (1400/1750 МГц, 2 Гбит/с, 16 Гбайт).
Прим. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства. Видеокарты с заводским разгоном приведены в соответствие с референсными параметрам (или приближены к последним) при условии, что это можно сделать без ручной правки кривой тактовых частот. В противном случае (ускорители серии NVIDIA GeForce 16, а также GeForce RTX 2070/2080/2080 Ti Founders Edition) используются настройки производителя.
⇡#Тактовые частоты, энергопотребление, температура, уровень шума и разгон
Графический процессор GA104 на плате GeForce RTX 3070 Founders Edition работает в том же частотном диапазоне, что и флагманский чип Ampere в составе RTX 3080 и RTX 3090: под игровой нагрузкой средняя тактовая частота видеоядра стабилизировалась в районе 1919 МГц. По опыту знакомства с партнерскими версиями старших моделей было бы резонно предположить, что эти числа можно проецировать и на высококачественные реализации RTX 3070 с кулерами и печатными платами оригинального дизайна.
Но в данном случае у нас нет уверенности в том, то Founders Edition целиком раскрывает потенциал графического процессора, ведь согласно спецификациям RTX 3070 положены наивысшие тактовые частоты во всей, пока еще до конца не сформированной, линейке GeForce 30, к чему располагает и небольшое по сравнению с GA102 количество транзисторов в кристалле. При этом RTX 3070 Founders Edition получает дополнительное питание через единственный восьмиконтактный разъем (с использованием комплектного переходника) и в штатном режиме упирается в номинал мощности восьмиконтактника (150 Вт) вместе с разъемом PCI Express (75 Вт). Под нагрузкой в играх видеокарта потребляет вплоть до 229 Вт, и судя по замерам в FurMark, уже не располагает неисчерпанным резервом. Вместе с тем налицо значительная экономия мощности по сравнению с GeForce RTX 2080 Ti — ускорителем прошлого поколения, который (как мы успеем убедиться, изучив результаты бенчмарков) действительно является аналогом RTX 3070 по игровому быстродействию. Также стоит обратить внимание на то, что RTX 3070 находится фактически в одной категории потребляемой мощности с Radeon RX 5700 XT (213 Вт у референсной модели), но это лучше характеризует кремний Navi первого поколения, перегретый завышенным напряжением, чем новинку NVIDIA.
Рабочие параметры под нагрузкой (Crysis 3) | |||||||
---|---|---|---|---|---|---|---|
Видеокарта | Настройки | Тактовая частота GPU, МГц | Напряжение питания GPU, В | Частота вращения вентиляторов, об/мин (% от макс.) | Частота вращения вентиляторов 2, об/мин (% от макс.) | ||
Средн. | Макс. | Средн. | Макс. | Средн. | Средн. | ||
NVIDIA GeForce RTX 3070 FE (1500/1730 МГц, 14 Гбит/с, 8 Гбайт) | 1919 | 1935 | 1,00 | 1,01 | 1767 (50%) | 1766 (50%) | |
NVIDIA GeForce RTX 3070 FE (+50 МГц, 17,2 Гбит/с, 8 Гбайт) | +9% мощности | 1962 | 1980 | 1,00 | 1,02 | 1833 (51%) | 1832 (51%) |
NVIDIA GeForce RTX 3080 FE (1440/1710 МГц, 19 Гбит/с, 10 Гбайт) | 1900 | 1920 | 1,04 | 1,06 | 1747 (49%) | 1747 (52%) | |
NVIDIA GeForce RTX 3090 FE (1395/1695 МГц, 19,5 Гбит/с, 24 Гбайт) | 1987 | 2010 | 1,04 | 1,08 | 1141 (43%) | 1141 (43%) | |
NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11000 Мбит/с, 11 Гбайт) | 1735 | 1810 | 0,96 | 1,01 | 2377 (50%) | Н/Д | |
NVIDIA GeForce RTX 2070 FE (1410/1710 МГц, 14 Гбит/с, 8 Гбайт) | 1812 | 1845 | 0,98 | 1,00 | 1999 (54%) | 1999 (54%) | |
NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) | 1907 | 1920 | 1,03 | 1,04 | 1969 (53%) | 1969 (53%) | |
NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) | 1723 | 1860 | 0,91 | 1,03 | 2082 (56%) | 2082 (56%) | |
AMD Radeon VII (1800 МГц, 2000 Мбит/с, 16 Гбайт) | 1756 | 1786 | Н/Д | Н/Д | 2617 (Н/Д) | Н/Д | |
AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт) | Термопаста ARCTIC MX-2 вместо графитовой прокладки | 1795 | 1819 | 1,07 | 1,18 | 2102 (43%) | Н/Д |
Прим. Измерение всех параметров выполняется после прогрева GPU и стабилизации тактовых частот.
Действительно, на эффективном оверклокинге графического процессора GeForce RTX 3070 Founders Edition можно поставить крест. BIOS видеокарты позволяет увеличить TBP всего лишь на 9%, а попытки разгона GPU не прибавили больше 50 МГц к номинальной тактовой частоте и 42 МГц к реальной частоте под нагрузкой. Порадовала только оперативная память: стартуя со штатной пропускной способности 14 Гбит/с, микросхемы GDDR6 покорили отметку 17,2 Гбит/с. А ведь наш экземпляр Founders Edition комплектуется чипами GDDR6 точно такого же номинала, как предполагают спецификации видеокарты. Складывается впечатление, будто второму по 
Полный текст статьи читайте на 3DNews