Видеоускоритель Nvidia GeForce RTX 4070 (12 ГБ): теория и архитектура, описание карты Palit, синтетические и игровые тесты (включая тесты с трассировкой лучей), выводы

Общая информация о GeForce RTX 4070

При анонсе графической архитектуры Ada Lovelace в прошлом году, компания Nvidia рассказала сразу о трех видеокартах на ее основе: топовой GeForce RTX 4090 и пары RTX 4080, отличающихся друг от друга не только объемом видеопамяти. Решения выпускались на рынок не одновременно, и одно даже успело поменять наименование в правильную сторону, из RTX 4080 12 ГБ став моделью RTX 4070 Ti. Мы ранее рассмотрели их все, а сегодня настало время еще одной видеокарты — младшей модели GeForce RTX 4070 — уже без приставки Ti. Собственно, нового в ней не очень много, она основана на урезанной версии графического процессора AD104, который мы уже знаем по RTX 4080 12 ГБ RTX 4070 Ti.

Новая графическая архитектура получила множество улучшений: улучшенные RT-ядра с большей пиковой производительностью и дополнительными аппаратными возможностями: Opacity Micromap и Displaced Micro-Mesh, ускоряющими трассировку полупрозрачной геометрии и использующими микротреугольники для достижения большей геометрической сложности. Важнейшим изменением является и изменяемый порядок шейдерных вычислений Shader Execution Reordering, который в теории способен дать приличный прирост производительности при трассировке лучей.

В общем, графические процессоры архитектуры Ada в полтора-два раза (смотря как оценивать и в каких условиях) производительнее GPU предыдущего поколения в растеризации и трассировке лучей, но также они выделяются новой технологией увеличения производительности — DLSS 3, которая позволяет дополнительно повысить частоту кадров. Главное нововведение DLSS 3 заключается в генерации дополнительных кадров на основе существующих, для чего используется аппаратный движок Optical Flow Accelerator, интерполирующий соседние кадры и создающий на их основе новые.

Ну, а создать столь сложные GPU с увеличенной производительностью и лучшей энергоэффективностью позволил модифицированный под потребности компании техпроцесс TSMC 4N с технологическими нормами 5 нм. GeForce RTX 4070 основана на урезанной версии графического процессора AD104, который имеет 5888 активных CUDA-ядер, что обеспечивает пиковую вычислительную производительность в 29 терафлопс для FP32-вычислений. Также архитектура Ada Lovelace отличается серьезно увеличенным объемом кэш-памяти второго уровня — RTX 4070 имеет 36 МБ L2-кэша, в отличие от всего лишь 4 МБ у видеокарты предыдущего поколения — RTX 3070 Ti. Это улучшает задержки доступа к ресурсам, повышает производительность и снижает нагрузку на видеопамять, что в итоге выливается в заметно лучшую энергоэффективность.

Как и старшая модель RTX 4070 Ti, рассматриваемая сегодня видеокарта предназначена для разрешения 2560×1440 при максимальных графических настройках, включая трассировку лучей, а также для 4K-разрешения при условии использования технологии DLSS. Как обычно, при выпуске новой модели видеокарты Nvidia предполагает, что она может стать неплохим вариантом для модернизации видеосистемы у владельцев старого железа. По их задумке, GeForce RTX 4070 хорошо подойдет для замены таких видеокарт прошлого, как GTX 1080 и RTX 2070. Хотя вторая также поддерживает аппаратную трассировку лучей, но лишь на зачаточном уровне — с тех пор требовательность к производительности заметно увеличилась, и даже одно наличие последнего поколения RT-блоков и тензорных ядер в RTX 4070 многое меняет. Ускоренная трассировка лучей и технология повышения производительности DLSS 3 совместно могут обеспечить приемлемый комфорт в играх при скорости рендеринга на уровне RTX 3080, но с потреблением энергии меньше чем даже у RTX 3070.

Графическая архитектура Ada Lovelace во многом схожа с архитектурой Ampere, на которой основаны различные модификации чипов GA10x, обе эти архитектуры имеют достаточно много общего и с предыдущими архитектурами Turing и Volta, и перед прочтением материала будет полезно ознакомиться с нашими предыдущими статьями по теме:

Графический ускоритель GeForce RTX 4070
Кодовое имя чипа AD104
Технология производства 5 нм (TSMC 4N)
Количество транзисторов 35,8 млрд
Площадь ядра 294,5 мм²
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти 192-битная: 6 независимых 32-битных контроллеров памяти с поддержкой памяти типа GDDR6X
Частота графического процессора до 2475 МГц
Вычислительные блоки 46 (из 60) потоковых мультипроцессоров, включающих 5888 (из 7680) CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64
Тензорные блоки 184 (из 240) тензорных ядра для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32
Блоки трассировки лучей 46 (из 60) RT-ядер для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования 184 (из 240) блока текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 8 (из 10) широких блоков ROP на 64 (из 80) пикселя с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов поддержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a)
Спецификации видеокарты GeForce RTX 4070
Частота ядра 1920/2475 МГц
Количество универсальных процессоров 5888
Количество текстурных блоков 184
Количество блоков блендинга 64
Эффективная частота памяти 21 ГГц
Тип памяти GDDR6X
Шина памяти 192 бита
Объем памяти 12 ГБ
Пропускная способность памяти 504 ГБ/с
Вычислительная производительность (FP32) до 29,2 терафлопс
Теоретическая максимальная скорость закраски 159 гигапикселей/с
Теоретическая скорость выборки текстур 456 гигатекселей/с
Шина PCI Express 4.0×16
Разъемы по выбору производителя
Энергопотребление до 200 Вт
Дополнительное питание по выбору производителя
Число слотов, занимаемых в системном корпусе по выбору производителя
Рекомендуемая цена $599

Название новой модели полностью соответствует принципу наименования решений компании, которую чуть не испортила модель на ступень выше с первоначальным названием RTX 4080 12 ГБ, ставшая в итоге RTX 4070 Ti. Новинка на урезанном чипе AD104 заняла позицию в линейке на ступень ниже RTX 4070 Ti, как и должно быть, исходя из здравого смысла.

За цену в $600 на рынке настольных видеокарт конкурентов у RTX 4070 пока что нет, ибо младшая из топовых видеокарт AMD Radeon RX 7900 XT является конкурентом RTX 4070 Ti и стоит еще дороже. Новое решение Nvidia отличается еще меньшей ценой, чем эти две видеокарты, поэтому сравнивать с RX 7900 XT новинку не совсем правильно, но деваться некуда — ничего нового из текущего поколения AMD пока что не представила.

С объемом видеопамяти у новинки всё понятно — из-за ширины шины был ровно такой же выбор, как и у RTX 4070 Ti — или 12 ГБ или 24 ГБ, и для уровня цены RTX 4070 второй вариант кажется явным перебором. А вот 12 ГБ вполне достаточны на данный момент, и наличие 20 ГБ видеопамяти против 12 ГБ у условного конкурента Radeon RX 7900 XT не скажется на результатах — по крайней мере, в уже вышедших играх и при нормальных условиях. Но всё же есть уже первые звоночки нехватки 8–10 ГБ видеопамяти, и вполне может настать время, когда и 12 ГБ может не хватать при высоких графических настройках — в плохо портированных с консолей играх с плохим менеджментом ресурсов, к примеру.

Так как ограничение потребления энергии у RTX 4070 установлено на уровне лишь 200 Вт, то для питания видеокарт новой модели не обязательно использовать новый 16-контактный разъем питания PCIe 5.0, ставший стандартом для ATX 3.0, который мы видели еще на GeForce RTX 3090 Ti. С учетом передаваемых по разъему PCIe 75 Вт, достаточно лишь одного привычного 8-контактного разъема для дополнительного питания видеокарты. Конечно же, производители могут считать иначе и установить два таких разъема — для большей стабильности при разгоне, к примеру.

Вообще, производители дают некие значения, ограничивающие максимальное энергопотребление всей видеокартой, но реальные значения потребления энергии в играх зачастую заметно ниже. Так, при максимальном потреблении в 200 Вт для RTX 4070, по измерениям самой Nvidia, новая видеокарта в играх потребляет в среднем чуть меньше — порядка 186 Вт. Это значительно меньше, чем 320 Вт у RTX 3080 в тех же условиях при схожей производительности, заметно меньше 240 Вт у RTX 3070 Ti и даже меньше чем 215 Вт, которые потребляет модель RTX 3070 из предыдущего поколения. Соответственно, у RTX 4070 очень хорошая энергоэффективность, значительно превосходящая параметры линейки RTX 30.

Интересно, что в случае видеокарты GeForce RTX 4070 компания Nvidia решила также выпустить модель в собственном исполнении — Founders Edition. FE-издание сочетает многие элементы конструкции и дизайна, уже виденные нами в GeForce RTX 4080 и RTX 4090 Founders Edition — применяются аналогичные материалы и строгий дизайн с двумя вентиляторами, один из которых продувает радиатор насквозь. Система охлаждения RTX 4070 Founders Edition была улучшена по сравнению с видеокартами серии RTX 3070, она имеет медную основу с четырьмя тепловыми трубками, которая эффективно отводит тепло от графического процессора AD104 и передает ее остальной части радиатора. Вентиляторы этой версии RTX 4070 обеспечивают на 20% больший воздушный поток по сравнению с кулером RTX 3070 Ti FE. В модели Founders Edition используется шесть фаз в подсистеме питания, две из которых выделены на обеспечение работы чипов GDDR6X-памяти.

Впрочем, на нашем рынке FE от Nvidia официально всё равно не продается по понятным причинам, но горевать не нужно — партнеры компании уже анонсировали и выпустили на рынок по несколько решений собственного дизайна, включая разогнанные варианты, имеющие улучшенные системы питания и охлаждения. Модели GeForce RTX 4070 доступны в разных модификациях у партнеров компании: Asus, Colorful, Gainward, Galaxy, Gigabyte, Innovision 3D, MSI, Palit, PNY, Zotac и других.

Особенности архитектуры

В линейке видеокарт GeForce RTX 40 применяются графические процессоры AD10x, основанные на графической архитектуре Ada Lovelace. Инженеры компании Nvidia спроектировали графическую архитектуру, которая не только повысила производительность операций трассировки лучей и машинного вычисления на тензорных ядрах, но и предоставила некоторые новые возможности, позволяющие улучшить эффективность, также заметно повлиял переход на современный технологический процесс тайваньской компании TSMC, позволивший разместить в чипах большое количество исполнительных блоков. Новые GPU получились заметно более сложными, но при этом они работают на высокой тактовой частоте по сравнению с решениями предыдущих серий.

Графический процессор AD104 включает в себя все возможности и особенности флагманского решения AD102, включая RT-ядра третьего поколения и тензорные ядра четвертого — то есть поддерживает все улучшения трассировки лучей, а также технологию увеличения производительности DLSS 3 и новый ускоритель оптического потока OFA. Кристалл AD104 в составе модели видеокарты GeForce RTX 4070 обеспечивает высокий уровень производительности — примерно на уровне модели RTX 3080 из предыдущего поколения, и при гораздо меньшем уровне энергопотребления.

Как и все графические процессоры компании Nvidia, чип AD104 состоит из укрупненных кластеров Graphics Processing Cluster (GPC), которые включают несколько кластеров текстурной обработки Texture Processing Cluster (TPC), содержащих потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации ROP и контроллеры памяти. Как и в предыдущих архитектурах, кластер GPC самостоятельно производит все основные вычисления внутри кластера, и включает свой движок растеризации Raster Engine, шесть кластеров TPC, состоящих из 12 мультипроцессоров SM. Но выше мы говорили о полноценном GPU, а в RTX 4070 применяется урезанная версия:

Как видите, в случае видеокарты GeForce RTX 4070 используется довольно сильно урезанный по количеству функциональных блоков вариант этого чипа. Из пяти вычислительных кластеров GPC один отключен полностью, а в одном из четырех оставшихся отключен кластер TPC, состоящий из пары мультипроцессоров SM. Получается 23 (из 30) кластера текстурной обработки TPC, 46 (из 60) потоковых мультипроцессоров SM, но все шесть 32-битных контроллеров памяти (192-бит в целом). Всего же такая версия GPU содержит 5888 CUDA-ядер, 46 RT-ядер, 184 тензорных ядра, 184 текстурных блока TMU и 64 блока ROP. Подсистема памяти включает 5888 КБ L1-кэша и 36 (из 48) МБ L2-кэша.

Каждый мультипроцессор в чипах AD10x содержит по 128 CUDA-ядер, по одному RT-ядру третьего поколения, по четыре тензорных ядра четвертого поколения, по четыре текстурных блока TMU, регистровый файл на 256 КБ и 128 КБ L1-кэша или разделяемой памяти, объем которых конфигурируется по необходимости. Количество блоков текстурирования и заполнения возросло по сравнению с аналогичными графическими процессорами семейства Ampere, что должно сказаться при упоре в скорость текстурных выборок и заполнения, что иногда встречается в играх.

В GeForce RTX 4070 применяется GDDR6X-память, и ее эффективная рабочая частота составляет 21 ГГц — общая пропускная способность памяти в этом случае превышает 500 ГБ/с, а это ровно как у старшей модели RTX 4070 Ti, основанной на полноценном чипе AD104, так что от нехватки пропускной способности новинка вряд ли будет страдать. Общий объем видеопамяти составляет 12 ГБ, что достаточно для решения такого уровня, но может сказаться в будущем. По сравнению с семейством RTX 30, значительно вырос объем кэш-памяти второго уровня — 36 МБ, в отличие от всего лишь 6 МБ даже в топовой модели RTX 3090 Ti. Это должно сгладить нехватку ПСП, а некоторые приложения получат дополнительное преимущество от большого объема кэш-памяти.

Сравним теоретические показатели трех выпущенных моделей видеокарт серии GeForce RTX 40 (кроме топовой RTX 4090), основанных на разных чипах линейки AD10x, с некоторыми из моделей предыдущей линейки Ampere, соответствующими им по позиционированию. Это позволит оценить теоретическую разницу между видеокартами двух поколений.

  RTX 4080 RTX 4070 Ti RTX 4070 RTX 3080 Ti RTX 3070 Ti RTX 3070
Кристалл AD103 AD104 AD104 GA102 GA104 GA104
Кол-во транзисторов, млрд. 45,9 35,8 35,8 28,3 17,4 17,4
Площадь, мм² 379 295 295 628 393 393
CUDA-ядра 9728 7680 5888 10240 6144 5888
Тензорные ядра 304 240 184 320 192 184
RT-ядра 76 60 46 80 48 46
Базовая частота, ГГц 2,21 2,31 1,92 1,37 1,58 1,50
Турбо-частота, ГГц 2,51 2,61 2,48 1,67 1,77 1,73
Производительность FP32, ТФлопс 48,7 40,1 29,2 34,1 21,8 20,3
Текстурирование, ГТекс/с 762 626 456 533 340 317
Скорость заполнения, ГПикс/с 281 209 159 187 170 166
Объем памяти, ГБ 16 12 12 12 8 8
Шина памяти, бит 256 192 192 384 256 256
ПСП, ГБ/с 717 504 504 912 608 448
Потребление, Вт 320 285 200 350 290 220

Хорошо видно, что RTX 4070 имеет гораздо меньше исполнительных блоков, чем RTX 4070 Ti — хотя они и основаны на одном и том же GPU, но в разных версиях. RTX 4070 — это наиболее массовый продукт новой линейки Nvidia. По теоретическим показателям эта видеокарта близка к уровню RTX 3080 и немного уступает такой же модели с индексом Ti, зато имеет чуть ли не вдвое меньшее энергопотребление и вдвое меньшую площадь кристалла, благодаря 5-нанометровому техпроцессу. Можно предположить, что RTX 4070 должна быть где-то на уровне RTX 3080, а то и Ti, но с куда лучшими показателями энергоэффективности, а за счет DLSS 3 будет опережать их в играх с поддержкой этой технологии.

Все архитектурные улучшения семейства Ada Lovelace были разобраны нами в теоретическом обзоре, там подробно описаны все изменения в RT-ядрах новой архитектуры, включая аппаратные блоки Opacity Micromap Engine и Displaced Micro-Mesh Engine, а также дополнительный планировщик для изменения порядка выполнения шейдеров Shader Execution Reordering, позволяющие повысить эффективность аппаратной трассировки лучей.

Там же подробно расписана и работа технологии DLSS 3, которая стала не просто технологией масштабирования разрешения, как DLSS 2, а приобрела возможность вставки дополнительных кадров на основе информации из существующих, что увеличивает их частоту и плавность видеоряда в итоге. DLSS 3 состоит из трех частей: генерация кадров Frame Generation, увеличение разрешения Super Resolution (то, что мы знаем под именем DLSS 2) и технология снижения задержек Reflex. Видеокарты серии RTX 40 поддерживают все три, а предыдущие модели — две, за исключением генерации кадров, и DLSS в играх будет работать на всех GPU, просто с разными возможностями. Важно, что DLSS 3 сразу получила поддержку большого количества игровых разработчиков и игровых движков.

И как раз одним из явных преимуществ GeForce RTX 4070 перед аналогичными по мощности GPU предыдущего поколения и является поддержка генерации (интерполяции) кадров в составе технологии DLSS 3, которой лишены и RTX 3080 и RTX 3090 Ti. Именно за счет этого RTX 4070 может обеспечить большую частоту кадров по сравнению с топовыми видеокартами серии RTX 30. Конечно, в режиме рендеринга с трассировкой пути, появившемся на днях в игре Cyberpunk 2077, в разрешении 4K эта видеокарта всё равно не сможет обеспечить комфортную игру, но вместе с DLSS 3 в разрешении 2560×1440 должно получиться вполне неплохо. Не говоря уже об остальных играх с гибридным рендерингом и частичной трассировкой лучей, в которых можно будет комфортно играть и в 4K, скорее всего.

На сегодняшний день в Nvidia насчитали более 400 игр и приложений с поддержкой RTX (в которую входит не только трассировка лучей, но и DLSS в любом виде), среди которых более 30 игр уже поддерживают генерацию кадров DLSS 3, а анонсирована она еще в паре десятков проектов. Это такие популярные игры, как Forza Horizon 5, Diablo IV, Redfall и другие. Поддержку DLSS 3 получает всё большее количество игр от разных разработчиков, ведь если уже есть поддержка DLSS 2 при помощи специализированного Nvidia Streamline SDK, то для интеграции всех составляющих DLSS 3 (AI Super Resolution, AI Frame Generation и Nvidia Reflex) практически всё уже готово. Известный игровой движок Unreal Engine получил DLSS 2 плагин еще в феврале 2021 года, а такую же поддержку для DLSS 3 планируется выпустить в ближайшее время. Это позволит всем разработчикам, использующим последнюю версию движка — Unreal Engine 5.2, получить все преимущества DLSS 3, включая генерацию кадров.

А нам осталось упомянуть возможности GeForce RTX 4070 по работе с видеоданными. Неудивительно, что они не отличаются от таковых у других моделей серии — в специализированном аппаратном кодировщике NVEnc восьмого поколения появилась поддержка кодирования видео в формате AV1, кодировщик AV1 в Ada на 40%-50% эффективнее кодировщика H.264, используемого в графических процессорах предыдущей серии, и новый формат AV1 позволит увеличить разрешение видеопотока при стриминге с 1080p до 1440p при том же битрейте. Кроме этого, представленные графические процессоры Ada имеют по два аппаратных кодировщика NVEnc на борту, что позволяет кодировать видеоданные с разрешением 8K при 60 FPS или сразу четыре видеопотока разрешения 4K при 60 FPS — и при этом быстрее, чем на RTX 3090 Ti.

Кроме NVEnc, в графические процессоры архитектуры Ada включен аппаратный декодер пятого поколения NVDec, который появился в Ampere. Он поддерживает декодирование видеоданных с аппаратным ускорением в форматах: MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 и AV1. Также полностью поддерживается и декодирование видеоданных в разрешении 8K при 60 FPS. На этом с теоретической частью мы закончили и переходим к рассмотрению практических особенностей видеокарты GeForce RTX 4070 в исполнении компании Palit.

Особенности карты Palit GeForce RTX 4070 Dual OC 12 ГБ

Сведения о производителе: Компания Palit Microsystems (торговая марка Palit) основана в 1988 году в Китайской Республике (Тайвань). Штаб-квартира — в Тайбэе/Тайвань, крупный центр по логистике — в Гонконге, второй офис (по продажам в Европе) — в Германии. Фабрики — в Китае. На рынке в России — с 1995 года (начинались продажи как безымянных продуктов, так называемых Noname, а под маркой Palit продукты начали идти только после 2000 года). В 2005 году компания приобрела торговую марку и ряд активов Gainward (после, по сути, банкротства одноименной компании), после чего был образован холдинг Palit Group. Был открыт еще один офис в Шеньжене, направленный на продажи в Китае. На сегодня внутри Palit Group сосредоточено еще несколько торговых марок и брендов.

Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) Palit GeForce RTX 4070 Dual OC 12 ГБ 192-битной GDDR6X

Palit GeForce RTX 4070 Dual OC 12 ГБ 192-битной GDDR6X
Параметр Значение Номинальное значение (референс)
GPU GeForce RTX 4070 (AD104)
Интерфейс PCI Express x16 4.0
Частота работы GPU (ROPs), МГц 2550(Boost)—2790(Max) 2475(Boost)—2760(Max)
Частота работы памяти (физическая (эффективная)), МГц 2625 (21000) 2625 (21000)
Ширина шины обмена с памятью, бит 192
Число вычислительных блоков в GPU 46
Число операций (ALU/CUDA) в блоке 128
Суммарное количество блоков ALU/CUDA 5888
Число блоков текстурирования (BLF/TLF/ANIS) 184
Число блоков растеризации (ROP) 64
Число блоков Ray Tracing 46
Число тензорных блоков 184
Размеры, мм 230×105×40 270×130×60
Количество слотов в системном блоке, занимаемые видеокартой 2 3
Цвет текстолита черный черный
Энергопотребление пиковое в 3D, Вт 194 200
Энергопотребление в режиме 2D, Вт 32 32
Энергопотребление в режиме «сна», Вт 11 11
Уровень шума в 3D (максимальная нагрузка), дБА 31,7 30,0
Уровень шума в 2D (просмотр видео), дБА 18,0 18,0
Уровень шума в 2D (в простое), дБА 18,0 18,0
Видеовыходы 1×HDMI 2.1, 3×DisplayPort 1.4a 1×HDMI 2.1, 3×DisplayPort 1.4a
Поддержка многопроцессорной работы нет
Максимальное количество приемников/мониторов для одновременного вывода изображения 4 4
Питание: 8-контактные разъемы 1 0
Питание: 6-контактные разъемы 0 0
Питание: 16-контактные разъемы 0 1
Вес карты с комплектом поставки (брутто), кг 1,065 1,8
Вес карты чистый (нетто), кг 0,75 1,3
Максимальное разрешение/частота, DisplayPort 3840×2160@144 Гц, 7680×4320@60 Гц
Максимальное разрешение/частота, HDMI 3840×2160@144 Гц, 7680×4320@60 Гц
Средняя цена карты Palit около 70 тысяч рублей на момент публикации обзора

Память

Карта имеет 12 ГБ памяти GDDR6X SDRAM, размещенной в 6 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6X, MT61K512M32KPA-21 / D8BZC) рассчитаны на номинальную частоту работы в 2625 (21000) МГц.

Особенности карты и сравнение с Palit GeForce RTX 4070 Ti GamingPro OC (12 ГБ)

Palit GeForce RTX 4070 Dual OC (12 ГБ) Palit GeForce RTX 4070 Ti GamingPro OC (12 ГБ)
вид спереди
вид сзади

Учитывая, что у RTX 4070 и 4070 Ti одно и то же графическое ядро AD104 (разница лишь в количестве активных блоков), то логично сравнить карты одного и того же производителя на базе RTX 4070/4070 Ti из самых бюджетных серий: в случае 4070 Ti — это GamingPro, в случае 4070 — Dual. Отлично видно, что обе карты очень похожи, практически единая основа. Понятно, что из-за разных разъемов питания (у данной модели 4070 — обычный 8-контактный разъем питания, в отличие от 12VHPWR у модели 4070 Ti) системы питания чуть отличаются, но не принципиально.

Ядро имеет маркировку AD104–250 (у 4070 Ti — AD104–400), защиты от майнинга нет, дата выпуска — 8-я неделя 2023 года.

Сбоку справа на карте мы видим посадочные места, предназначенные для подключения мощных внешних вентиляторов в системах, использующих профессиональные версии подобных видеокарт (для игровых и профессиональных видеокарт используются одни и те же GPU, разница может быть лишь в объеме памяти, конфигурации рабочих блоков и, конечно же, в программном обеспечении).

Суммарное количество фаз питания у карты Palit GeForce RTX 4070 Ti GamingPro OC — 11 (8+3), а вот у карты того же производителя на базе 4070 из серии Dual всего 8 фаз (6+2).

Зеленым цветом отмечена схема питания ядра, красным — памяти. Все ШИМ-контроллеры расположены на оборотной стороне PCB.

6ю фазами питания ядра управляет ШИМ-контроллер uP9512R (uPI Semiconductor). Он рассчитан максимум на 12 фаз.

Питанием микросхем памяти управляет ШИМ-контроллер uP9529Q (uPI Semiconductor).

В преобразователе питания, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае NCP302150 (On Semi), каждая из которых рассчитана максимально на 50 А.

Также на тыльной стороне платы имеется контроллер NCP45491 (On Semi), который отвечает за мониторинг карты (отслеживание напряжений и температуры).

Подсветка у карты очень простая, контроль за ней возложен на сам GPU, так что посадочное место под контроллер подсветки пустует.

Штатные частоты памяти равны референсным значениям, Boost-значения частоты работы ядра выше референс-аналога на 3%. А максимальная частота работы ядра лишь на 1% выше референс-аналога (в среднем мы получили в играх прирост производительности в 1,5% относительно референс-карты — то есть это почти ни о чем).

Энергопотребление карты Palit в тестах доходило до 194 Вт (в пике 225 Вт).

Предел лимита энергопотребления у данной карты поднять нельзя, так что пробовать ручной разгон не стал.

Питание на карту Palit подается через обычный 8-контактный разъем питания стандарта PCIe 2.0.

Габариты данной карты невелики, особенно по толщине: 4 см. В результате видеокарта занимает 2 слота в системном блоке (мы уже забыли, что такое бывает).

RTX 4070 не обладает поддержкой мультиграфической конфигурации, то есть технологии SLI, и у карты нет специального разъема на верхнем торце.

Управление работой карты обеспечивается с помощью фирменной утилиты Thunder Master.

Панель разгона позволяет настроить частоты работы карты, а также задать авторазгон

Панель мониторинга состояния карты

Панель управления вентиляторами

Нагрев и охлаждение

Мы видим кулер, уже традиционно выполненный по концепции сквозного продува хвостовой части радиатора. Основой СО является многосекционный пластинчатый никелированный весьма узкий радиатор с тепловыми трубками, распределяющими тепло по ребрам радиатора.

Трубки припаяны к большой медной и никелированной пластине, которая охлаждает как ядро, так и микросхемы памяти (через термопрокладки). А для охлаждения преобразователей питания VRM имеется своя подошва на радиаторе.

Задняя пластина служит только элементом защиты PCB и является составной частью общей концепции дизайна.

Поверх радиатора установлен кожух с двумя вентиляторами ∅100 мм, работающими на единой частоте вращения (по умолчанию, но через программу ThunderMaster можно настроить их работу раздельно).

Остановка вентиляторов при малой нагрузке видеокарты происходит, если температура GPU опускается ниже 50 градусов, а нагрев микросхем памяти — ниже 80 градусов. Разумеется, СО при этом становится бесшумной. При запуске ПК вентиляторы работают, однако после загрузки видеодрайвера идет опрос рабочей температуры, и они выключаются.

Мониторинг температурного режима:

После 2-часового прогона под нагрузкой максимальная температура ядра не превысила 68 градусов (самой горячей точки — 82,5 °C), а температура микросхем памяти — 70 градусов, что является отличным результатом для видеокарт такого уровня. Энергопотребление карты доходило до 194 (пик 225) Вт. Напомним, что безопасный предел нагрева памяти GDDR6X — 105 °C.

Мы засняли и ускорили в 50 раз 8-минутный прогрев

Максимальный нагрев наблюдался в центральной части PCB, а также около разъема питания.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

  • Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
  • Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
  • Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума следующая:

  • менее 20 дБА: условно бесшумно
  • от 20 до 25 дБА: очень тихо
  • от 25 до 30 дБА: тихо
  • от 30 до 35 дБА: отчетливо слышно
  • от 35 до 40 дБА: громко, но терпимо
  • выше 40 дБА: очень громко

В режиме простоя в 2D температура была не выше 44,3 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось.

В режиме максимальной нагрузки в 3D температура достигала 68/82,5/70 °C (ядро/hot spot/память). Вентиляторы при этом раскручивались до 1500 оборотов в минуту, шум вырастал до 31,7 дБА: это совсем негромко, лишь отчетливо слышно, но при этом вентиляторы издают неприятный звенящий призвук, который может утомлять.

Спектрограмма шума как раз показывает те самые пики, вызывающие раздражение. При снижении частоты вращения вентиляторов ниже 500 оборотов в минуту неприятный звук мгновенно пропадает.

Не стоит забывать, что тепло, выделяемое картой, остается внутри системного блока, так что использование корпуса с хорошей вентиляцией крайне желательно.

Подсветка

Карта имеет очень скромную подсветку в виде ломаной линии на верхнем торце карты. В качестве некоторого «утешения» для любителей моддинговых штучек компания Palit предлагает возможность модификации кожуха СО, называется всё это «Автор» (Maker).

Концепция позволяет добавлять собственный дизайн на кожух СО. Владельцы видеокарт RTX 4ххх серии GamingPro, JetStream и Dual могут скачать с сайта Palit варианты образцов дизайна кожуха.

Более того, можно добавить что-то свое, изменить шаблон, проявить творчество, сохранить в виде проектов, затем отнести их в 3D-печать или распечатать на своем таком принтере, затем раскрасить. Ну и в конце концов открутить винты на передней крышке, снять держатели и установить свой вариант кожуха.

Управление режимами подсветки, в том числе и ее отключением, осуществляется той же утилитой ThunderMaster. Режимов крайне мало, они просты.

Комплект поставки и упаковка

В комплекте поставки кроме карты ничего больше нет.

Тестирование: синтетические тесты

Мы провели тестирование новой модели видеокарты Nvidia со стандартными частотами в нашем наборе синтетических тестов. Он продолжает меняться, иногда добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Мы постоянно стараемся расширять и улучшать набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.

Из более-менее новых бенчмарков мы начали использовать несколько дополнительных тестов для измерения производительности трассировки лучей и, а также технологий масштабирования разрешения и увеличения производительности: DLSS, FSR и&

Полный текст статьи читайте на iXBT