В ушедшем году компания Nvidia анонсировала сразу три видеокарты на основе новой графической архитектуры Ada Lovelace, которая продолжила дело предыдущих поколений Turing и Ampere, обеспечив значительно более высокую производительность в графических и неграфических применениях. Мы уже рассмотрели ранее две видеокарты этой серии, и новые графические процессоры флагманского уровня оказались в полтора-два раза производительнее предыдущих аналогов при растеризации и трассировке лучей, а также они выделяются новой технологией увеличения производительности — DLSS 3, которая позволяет дополнительно повысить частоту кадров. Главное нововведение DLSS 3 заключается в генерации дополнительных кадров на основе существующих, для чего используется аппаратный движок Optical Flow Accelerator, интерполирующий соседние кадры и создающий на их основе еще один.

Да и в остальном улучшений хватает: RT-ядра новой архитектуры обеспечивают вдвое бо́льшую пиковую производительность теста пересечения луча и треугольника, а также имеют дополнительные аппаратные блоки: Opacity Micromap Engine — ускоряющий трассировку полупрозрачной геометрии до двух раз, и Displaced Micro-Mesh Engine — использующий микротреугольники для достижения большей геометрической сложности. Еще одним важным изменением новой архитектуры является изменяемый порядок шейдерных вычислений — Shader Execution Reordering, который может дать до 40%-50% прироста производительности при интенсивной трассировке лучей.

Создать заметно более сложные и большие GPU с увеличенной производительностью при сохранившемся уровне потреблении энергии, позволил новый техпроцесс — модифицированный под потребности Nvidia процесс TSMC 4N с технологическими нормами 5 нм. Обзор двух старших моделей GPU новой линейки у нас был, и сегодня мы рассмотрим младшую из трех анонсированных видеокарт, основанную на чипе AD104. Видеокарта GeForce RTX 4070 Ti имеет пиковую вычислительную производительность более 40 терафлопс, что в теории соответствует возможностям флагмана прошлой линейки — GeForce RTX 3090 Ti, и это при более чем полуторакратной разнице в энергопотреблении. А если использовать технологии семейства Ada Lovelace, направленные на дальнейшее повышение производительности, то эта разница еще увеличится.

Модель GeForce RTX 4070 Ti обеспечит огромный скачок производительности при модернизации игровой системы с таких моделей видеокарт, как GeForce RTX 2080 и GeForce GTX 1080 Ti. Новая видеокарта предназначена для игроков, которые хотят получить функциональность новой архитектуры и очень высокую производительность, но при меньшей цене по сравнению с двумя верхними моделями новой линейки. Рассматриваемая сегодня видеокарта официально предназначена для разрешения 2560×1440 при максимальных графических настройках, включая трассировку лучей, а также для 4K-разрешения при условии использования DLSS. Новинка обеспечивает достаточно высокую производительность и в играх с продвинутой графикой с применением трассировки пути (path tracing): Portal with RTX и обновления Cyberpunk 2077 в режиме Overdrive RT.

GeForce RTX 4070 Ti неплохо подходит и для применения в профессиональных задачах по созданию цифрового контента — она достаточно производительная, имеет тензорные ядра, которые способны ускорять инструменты на основе искусственного интеллекта, а также аппаратные блоки для ускорения трассировки лучей, работа которых поддерживается в таких 3D-пакетах и движках, как Blender Cycles, Redshift, V-Ray, Octane и т. д. Все это позволит ускорить визуализацию сложных сцен и эффективнее работать над проектами.

Графическая архитектура Ada Lovelace во многом схожа с архитектурой Ampere, на которой основаны различные модификации чипов GA10x, обе эти архитектуры имеют достаточно много общего и с предыдущими архитектурами Turing и Volta, и перед прочтением материала будет полезно ознакомиться с нашими предыдущими статьями по теме:

Графический ускоритель GeForce RTX 4070 Ti
Кодовое имя чипа	AD104
Технология производства	5 нм (TSMC 4N)
Количество транзисторов	35,8 млрд (AD103 — 45,9 млрд)
Площадь ядра	294,5 мм² (AD103 — 378,6 мм²)
Архитектура	унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти	192-битная: 6 независимых 32-битных контроллеров памяти с поддержкой памяти типа GDDR6X
Частота графического процессора	до 2610 МГц
Вычислительные блоки	60 потоковых мультипроцессоров, включающих 7680 CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64
Тензорные блоки	240 тензорных ядер для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32
Блоки трассировки лучей	60 RT-ядер для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования	240 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP)	10 широких блоков ROP на 80 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов	поддержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a)

Спецификации видеокарты GeForce RTX 4070 Ti
Частота ядра	2310/2610 МГц
Количество универсальных процессоров	7680
Количество текстурных блоков	240
Количество блоков блендинга	80
Эффективная частота памяти	21 ГГц
Тип памяти	GDDR6X
Шина памяти	192 бита
Объем памяти	12 ГБ
Пропускная способность памяти	504 ГБ/с
Вычислительная производительность (FP32)	до 40,1 терафлопс
Теоретическая максимальная скорость закраски	209 гигапикселей/с
Теоретическая скорость выборки текстур	626 гигатекселей/с
Шина	PCI Express 4.0×16
Разъемы	по выбору производителя
Энергопотребление	до 285 Вт
Дополнительное питание	один 16-контактный разъем
Число слотов, занимаемых в системном корпусе	по выбору производителя
Рекомендуемая цена	$799

Название сегодняшней новинки из нового семейства в целом более-менее соответствует принципу наименования решений компании, особенно после того, как Nvidia изменила ее первое название «RTX 4080 12 ГБ» на RTX 4070 Ti. Именовать две абсолютно разные видеокарты на базе чипов разной мощности было неудачной идеей, как показала практика, и название второго варианта позднее решили поменять на более подходящее. Теперь она и по наименованию стоит на ступень ниже RTX 4080, а не почти наравне с «RTX 4080 16 ГБ».

На рынке видеокарт главным конкурентом RTX 4070 Ti является младшее из пары уже вышедших топовых видеокарт нового семейства AMD Radeon RX 7000. Причем в этот раз уже не конкурент стоит дешевле GeForce, а решение Nvidia отличается меньшей ценой, по сравнению с RX 7900 XT. Мы совсем скоро протестируем новинку AMD в том числе и в тестах трассировки лучей, но пока что очень похоже, что даже новое поколение Radeon по эффективности аппаратной трассировки догнало только Ampere, но не Ada. А производительность трассировки лучей стала важнейшим показателем для графических процессоров, так как скорости растеризации топовых GPU уже давно и так достаточно.

По объему видеопамяти для новой видеокарты у Nvidia в соответствии с шириной шины был выбор между 12 ГБ и 24 ГБ, и для RTX 4070 Ti первый вариант кажется вполне достаточным на данный момент. Прямо сейчас наличие 20 ГБ видеопамяти против 12 ГБ не принесет преимущества конкуренту новинки в виде Radeon RX 7900 XT — в существующих играх и типичных условиях. Но хотя пока что 12 ГБ памяти будет вполне достаточно при любых графических настройках, это все же можно считать потенциальным недостатком новинки Nvidia, который может негативно сказаться в будущем.

Для питания видеокарт новой модели используется все тот же 16-контактный разъем питания PCIe 5.0, ставший стандартом для ATX 3.0, который мы видели еще на GeForce RTX 3090 Ti. Блоки питания с подобным разъемом представлены на рынке, также можно применить переходник с пары более привычных 8-контактных разъемов. Редкие проблемы пользователей RTX 4090 с оплавлением этих разъемов касаются только топовой модели, а конкретно RTX 4070 Ti это вряд ли коснется, так как уровень энергопотребления для нее установлен в 285 Вт, и проблем возникнуть не должно.

В отличие от RTX 4090 и RTX 4080, модель RTX 4070 Ti не будет предлагаться рынку в варианте самой Nvidia — в виде решений специального издания Founders Edition. А вот партнеры компании уже анонсировали и выпустили на рынок по несколько решений собственного дизайна, включая разогнанные варианты, имеющие улучшенные системы питания и охлаждения. Модели GeForce RTX 4070 Ti уже доступны в разных модификациях у партнеров компании: Asus, Colorful, Gainward, Galaxy, Gigabyte, Innovision 3D, MSI, Palit, PNY, Zotac и других.

Особенности архитектуры

В линейке видеокарт GeForce RTX 40 применяются графические процессоры AD10x, основанные на графической архитектуре Ada Lovelace. Инженеры компании Nvidia спроектировали графическую архитектуру, которая не только повысила производительность операций трассировки лучей и машинного вычисления на тензорных ядрах, но и предоставила некоторые новые возможности, позволяющие улучшить эффективность, также заметно повлиял переход на современный технологический процесс тайваньской компании TSMC, позволивший разместить в чипах большое количество исполнительных блоков. Новые GPU получились заметно более сложными, но при этом они работают на высокой тактовой частоте, по сравнению с решениями предыдущих серий.

Графический процессор AD104 включает в себя все возможности и особенности AD102 флагманского решения, включая RT-ядра третьего поколения и тензорные ядра четвертого — то есть, поддерживает все улучшения трассировки лучей, а также технологию увеличения производительности DLSS 3 и новый ускоритель оптического потока OFA. Кристалл AD104 в составе модели видеокарты GeForce RTX 4070 Ti обеспечивает достаточно высокий уровень производительности — почти на уровне флагманского решения RTX 3090 Ti, основанного на чипе GA102 предыдущего поколения, но при гораздо меньшем уровне энергопотребления.

Как и все графические процессоры компании Nvidia, чип AD104 состоит из укрупненных кластеров Graphics Processing Cluster (GPC), которые включают несколько кластеров текстурной обработки Texture Processing Cluster (TPC), содержащих потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации ROP и контроллеры памяти. Как и в предыдущих архитектурах, кластер GPC самостоятельно производит все основные вычисления внутри кластера, и включает свой движок растеризации Raster Engine, шесть кластеров TPC, состоящих из 12 мультипроцессоров SM. Рассмотрим диаграмму графического процессора в полной конфигурации:

Модель видеокарты GeForce RTX 4070 Ti выполнена на основе полной версии графического процессора AD104, который содержит 35,8 миллиардов транзисторов и включает 5 вычислительных кластеров GPC, 30 кластеров текстурной обработки TPC, 60 потоковых мультипроцессоров SM и шесть 32-битных контроллеров памяти (192-бит в целом). Всего полноценный GPU содержит 7680 CUDA-ядер, 60 RT-ядер, 240 тензорных ядер, 240 текстурных блоков TMU и 80 блоков ROP. Подсистема памяти включает 7680 КБ L1-кэша, 15360 КБ регистрового файла и 48 МБ L2-кэша.

Каждый мультипроцессор в чипах AD10x содержит по 128 CUDA-ядер, по одному RT-ядру третьего поколения, по четыре тензорных ядра четвертого поколения, по четыре текстурных блока TMU, регистровый файл на 256 КБ и 128 КБ L1-кэша или разделяемой памяти, объем которых конфигурируется по необходимости. Количество блоков текстурирования и заполнения возросло по сравнению с аналогичными графическими процессорами семейства Ampere, что должно сказаться при упоре в скорость текстурных выборок и заполнения, что иногда встречается в играх.

Память в GeForce RTX 4070 Ti применяется уже знакомая — GDDR6X, и в случае рассматриваемой модели ее эффективная рабочая частота составляет 21 ГГц — общая пропускная способность памяти в этом случае превышает 500 ГБ/с, что аж вдвое меньше, чем у RTX 3090 Ti из предыдущего поколения, схожей с новинкой по теоретическим показателям производительности. Общий объем видеопамяти составляет 12 ГБ, что хоть и достаточно для решения такого уровня, но это также вдвое меньше, чем у RTX 3090 (Ti). Нехватка ПСП и сравнительно небольшой объем видеопамяти — это немногочисленные потенциальные недостатки новой видеокарты, ведь во многих случаях общая производительность рендеринга может упираться именно в это.

Возможно, часть проблем решат улучшения в подсистеме кэширования. Всего RTX 4070 Ti содержит 7680 КБ кэш-памяти первого уровня, по сравнению с 10752 КБ в топовой версии прошлого поколения — RTX 3090 Ti, зато значительно вырос объем кэш-памяти второго уровня — тут его целых 48 МБ, в отличие от всего лишь 6 МБ в той же RTX 3090 Ti. Это должно частично нивелировать нехватку ПСП, да и многие приложения получат преимущество от большого объема кэш-памяти — он положительно сказывается в сложных вычислительных задачах, вроде аппаратной трассировки лучей и растеризации — в играх и тестах с большим количеством полупрозрачных частиц, вроде бенчмарка 3DMark FireStrike.

Сравним теоретические показатели пары выпущенных моделей видеокарт серии GeForce RTX 40, основанных на разных чипах линейки AD10x, с некоторыми из моделей предыдущей линейки Ampere, что позволит наглядно оценить разницу между ними.

	RTX 4080	RTX 4070 Ti	RTX 3090 Ti	RTX 3080 Ti	RTX 3070 Ti
Кристалл	AD103	AD104	GA102	GA102	GA104
Кол-во транзисторов, млрд.	45,9	35,8	28,3	28,3	17,4
Площадь, мм²	379	295	628	628	393
CUDA-ядра	9728	7680	10752	10240	6144
Тензорные ядра	304	240	336	320	192
RT-ядра	76	60	84	80	48
Базовая частота, ГГц	2,21	2,31	1,56	1,37	1,58
Турбо-частота, ГГц	2,51	2,61	1,86	1,67	1,77
Производительность FP32, ТФлопс	48,7	40,1	40,0	34,1	21,8
Текстурирование, ГТекс/с	762	626	625	533	340
Скорость заполнения, ГПикс/с	281	209	208	187	170
Объем памяти, ГБ	16	12	24	12	8
Шина памяти, бит	256	192	384	384	256
ПСП, ГБ/с	717	504	1008	912	608
Потребление, Вт	320	285	450	350	290

Если сравнивать RTX 4070 Ti (бывшая «RTX 4080 12 ГБ») и RTX 4080 (бывшая «RTX 4080 16 ГБ»), то между ними налицо большая разница по количеству исполнительных блоков, по их теоретической производительности, а также по ПСП. Если RTX 4090 — бескомпромиссный флагман, то RTX 4080 подходит для большего количества пользователей, а RTX 4070 Ti — это еще более массовый продукт. При теоретической производительности по большинству показателей на уровне RTX 3090 Ti, новинка имеет более чем в полтора раза меньшее потребление энергии и вдвое меньшую площадь кристалла — все это благодаря новому 5-нанометровому техпроцессу. В целом, RTX 4070 Ti должна быть более чем в полтора раза энергоэффективнее, чем RTX 3090 Ti, и примерно на одном уровне с ней по производительности.

Рассматриваемую сегодня модель Nvidia явно делала для того, чтобы создать полный аналог RTX 3090 Ti по скорости. Из таблицы видно, что это им удалось — почти по всем важным показателям пиковой теоретической производительности они идентичны. Но именно что почти по всем — кроме пропускной способности видеопамяти, которая у RTX 4070 Ti ровно вдвое ниже! Да что там, даже у RTX 4090 она осталась на уровне RTX 3090 Ti, а 504 ГБ/с у новинки на фоне 1008 ГБ/с у флагманской видеокарты предыдущей серии вообще не воодушевляют. Надеемся на то, что увеличившийся в 8 раз объем кэш-памяти второго уровня позволит нивелировать этот недостаток, но уж очень он велик, и наверняка в жизни встретятся случаи, когда этого добиться не удастся.

Хотя по тестам самой Nvidia все шоколадно, конечно же — новая RTX 4070 Ti в худших случаях наравне с RTX 3090 Ti, а в лучших — вдвое-втрое быстрее. Но это уже явно с применением DLSS 3, да и вообще — где тот давно обещанный режим Overdrive для Cyberpunk 2077?

Все архитектурные улучшения семейства Ada Lovelace были разобраны нами в теоретическом обзоре, там подробно описаны все изменения в RT-ядрах новой архитектуры, включая аппаратные блоки Opacity Micromap Engine и Displaced Micro-Mesh Engine, а также дополнительный планировщик для изменения порядка выполнения шейдеров Shader Execution Reordering, позволяющие повысить эффективность аппаратной трассировки лучей.

Там же подробно расписана и работа технологии DLSS 3, которая стала не просто технологией масштабирования разрешения, как DLSS 2, а приобрела возможность вставки дополнительных кадров на основе информации из существующих, что увеличивает их частоту и плавность видеоряда в итоге. DLSS 3 состоит из трех частей: генерация кадров Frame Generation, увеличение разрешения Super Resolution (то, что мы знаем под именем DLSS 2) и технология снижения задержек Reflex. Видеокарты серии RTX 40 поддерживают все три, а предыдущие модели — две, за исключением генерации кадров, и DLSS в играх будет работать на всех GPU, просто с разными возможностями. Важно, что DLSS 3 сразу получила поддержку большого количества игровых разработчиков и игровых движков.

Возможности GeForce RTX 4070 Ti по работе с видеоданными не отличаются от таковых у флагманской модели — в специализированном аппаратном кодировщике NVEnc восьмого поколения появилась поддержка кодирования видео в формате AV1, кодировщик AV1 в Ada на 40%-50% эффективнее кодировщика H.264, используемого в графических процессорах предыдущей серии, и новый формат AV1 позволит увеличить разрешение видеопотока при стриминге с 1080p до 1440p при том же битрейте. Кроме этого, представленные графические процессоры Ada имеют по два аппаратных кодировщика NVEnc на борту, что позволяет кодировать видеоданные с разрешением 8K при 60 FPS или сразу четыре видеопотока разрешения 4K при 60 FPS — и при этом быстрее, чем на RTX 3090 Ti.

Кроме NVEnc, в графические процессоры архитектуры Ada включен аппаратный декодер пятого поколения NVDec, который появился в Ampere. Он поддерживает декодирование видеоданных с аппаратным ускорением в форматах: MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 и AV1. Также полностью поддерживается и декодирование видеоданных в разрешении 8K при 60 FPS. На этом с теоретической частью мы закончили и переходим к рассмотрению практических особенностей видеокарты GeForce RTX 4070 Ti в исполнении компании Palit.

Особенности карты Palit GeForce RTX 4070 Ti GameRock Classic OC 12 ГБ

Сведения о производителе: Компания Palit Microsystems (торговая марка Palit) основана в 1988 году в Китайской Республике (Тайвань). Штаб-квартира — в Тайбэе/Тайвань, крупный центр по логистике — в Гонконге, второй офис (по продажам в Европе) — в Германии. Фабрики — в Китае. На рынке в России — с 1995 года (начинались продажи как безымянных продуктов, так называемых Noname, а под маркой Palit продукты начали идти только после 2000 года). В 2005 году компания приобрела торговую марку и ряд активов Gainward (после, по сути, банкротства одноименной компании), после чего был образован холдинг Palit Group. Был открыт еще один офис в Шеньжене, направленный на продажи в Китае. На сегодня внутри Palit Group сосредоточено еще несколько торговых марок и брендов.

Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) Palit GeForce RTX 4070 Ti GameRock Classic OC 12 ГБ 192-битной GDDR6X

Palit GeForce RTX 4070 Ti GameRock Classic OC 12 ГБ 192-битной GDDR6X
Параметр	Значение	Номинальное значение (референс)
GPU	GeForce RTX 4070 Ti (AD104)
Интерфейс	PCI Express x16 4.0
Частота работы GPU (ROPs), МГц	BIOS P: 2760(Boost)—2850(Max) BIOS S: 2610(Boost)—2805(Max)	2610(Boost)—2805(Max)
Частота работы памяти (физическая (эффективная)), МГц	2625 (21000)	2625 (21000)
Ширина шины обмена с памятью, бит	192
Число вычислительных блоков в GPU	60
Число операций (ALU/CUDA) в блоке	128
Суммарное количество блоков ALU/CUDA	7680
Число блоков текстурирования (BLF/TLF/ANIS)	240
Число блоков растеризации (ROP)	80
Число блоков Ray Tracing	60
Число тензорных блоков	240
Размеры, мм	310×125×63	310×130×70
Количество слотов в системном блоке, занимаемые видеокартой	4	4
Цвет текстолита	черный	черный
Энергопотребление пиковое в 3D, Вт (BIOS P/BIOS S)	293/293	285
Энергопотребление в режиме 2D, Вт	40	40
Энергопотребление в режиме «сна», Вт	11	11
Уровень шума в 3D (максимальная нагрузка), дБА (BIOS P/BIOS S)	32,5/30,8	32,0
Уровень шума в 2D (просмотр видео), дБА	18,0	18,0
Уровень шума в 2D (в простое), дБА	18,0	18,0
Видеовыходы	1×HDMI 2.1, 3×DisplayPort 1.4a	1×HDMI 2.1, 3×DisplayPort 1.4a
Поддержка многопроцессорной работы	нет
Максимальное количество приемников/мониторов для одновременного вывода изображения	4	4
Питание: 8-контактные разъемы	0	0
Питание: 6-контактные разъемы	0	0
Питание: 16-контактные разъемы	1	1
Вес карты с комплектом поставки (брутто), кг	2,2	2,5
Вес карты чистый (нетто), кг	1,7	2,0
Максимальное разрешение/частота, DisplayPort	3840×2160@144 Гц, 7680×4320@60 Гц
Максимальное разрешение/частота, HDMI	3840×2160@144 Гц, 7680×4320@60 Гц
Средняя цена карты Palit	единичные предложения в районе 83–88 тысяч рублей на момент подготовки обзора

Память

Карта имеет 12 ГБ памяти GDDR6X SDRAM, размещенной в 6 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6X, MT61K512M32KPA-21 / D8BZC) рассчитаны на номинальную частоту работы в 2625 (21000) МГц.

Особенности карты и сравнение с Palit GeForce RTX 4080 GameRock

Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ)	Palit GeForce RTX 4080 GameRock (16 ГБ)
вид спереди

вид сзади

Мы сравниваем карту Palit с ее же продуктом на базе RTX 4080 по двум причинам: во-первых, эталонной карты Nvidia на базе RTX 4070 Ti (12 ГБ) никто из медиасообщества в РФ не получал; во-вторых, интересно сравнить рассматриваемую сейчас карту со «старшей сестрой». В целом мы видим, что карты сильно отличаются, хотя, казалось бы, можно было просто убрать с карты RTX 4080 две микросхемы памяти, получив тем самым и объем 12 ГБ, и 192-битную шину обмена с памятью. В случае поколения RTX 30 часто делалось именно так, когда карты, имеющие в качестве GPU один и тот же физический чип, использовали разводку PCB под максимальную ширину шины, а дальше уже комплектовались разным количеством микросхем памяти. Печатная плата под RTX 4080 имеет максимальную ширину шины 256 бит, и по наличию двух пустых посадочных мест для микросхем памяти на PCB RTX 4070 Ti можно предположить, что разводка карты точно такая же, под ширину шины в 256 бит, да и размеры обеих карт по сути одинаковые. Зачем тогда надо было существенно переделать PCB под RTX 4070 Ti? Ответ получен из инсайдерской среды Nvidia: разводка чипа AD104 сильно отличается от предыдущих, потому требует установки на плату со смещением на 90 градусов, и это вызывает существенные переделки в разводке.

Сбоку справа на карте мы видим посадочные места, похожие на те, куда устанавливаются 8-контактные разъемы питания. На самом деле они предназначены для подключения мощных внешних вентиляторов в системах, использующих профессиональные версии подобных видеокарт (для игровых и профессиональных видеокарт используются одни и те же GPU, разница может быть лишь в объеме памяти, конфигурации рабочих блоков и, конечно же, в программном обеспечении).

Ядро имеет маркировку AD104–400, защиты от майнинга нет, дата выпуска — 43-я неделя 2022 года (октябрь).

Суммарное количество фаз питания у карты Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ) — 14, а у ее собрата на RTX 4080 — 18.

При этом распределение фаз такое: у Palit GeForce RTX 4080 GameRock — 15 фаз на ядро и 3 на микросхемы памяти, у карты Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ) — 12 + 2.

Зеленым цветом отмечена схема питания ядра, красным — памяти. Обоими схемами (12+2) управляет один ШИМ-контроллер MP2891 (Monolithic Power Systems), расположенный на оборотной стороне PCB. Это новый контроллер, есть данные, что он рассчитан максимум на 16 фаз.

В преобразователе питания, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае MP86957 (Monolithic Power Systems), каждая из которых рассчитана максимально на 70 А.

На тыльной стороне платы имеется контроллер uS5650Q (uPI Semiconductor), который отвечает за мониторинг карты (отслеживание напряжений и температуры).

Управление подсветкой традиционно возложено на контроллер Holtek.

Карта имеет два режима работы, они заложены в двух вариантах BIOS, которые переключаются с помощью переключателя на верхнем торце: P (performance / производительный, он же 1) и S (silent / тихий, он же 2). Разница между режимами не только в оборотах вентиляторов, но и в частотах работы GPU, плюс небольшая разница в лимитах: предел энергопотребления для BIOS P заложен в 330 Вт, а для BIOS S — в 285 Вт.

Штатные частоты памяти в обоих режимах BIOS равны референсным значениям. При этом Boost-значение частоты работы ядра в BIOS 1(P) выше референс-аналога почти на 6,8%. Исследования показали, что в среднем мы получили в играх прирост производительности на 5% относительно референс-карты. Частоты работы ядра в BIOS 2(S) соответствуют референс-значениям.

Энергопотребление карты Palit в пиках доходило до 293 Вт в обоих режимах BIOS.

Я попробовал ручной разгон и получил максимальные частоты 3000/23000 МГц, что обеспечило прирост в играх в разрешении 4К в среднем почти на 8% относительно референсных значений (лимит потребления можно поднять до 112%), энергопотребление карты выросло при этом до 315 Вт.

Питание на карту Palit подается через новый 16-контактный разъем питания стандарта PCIe 5.0.

В комплекте поставки карты имеется переходник на такой разъем с двух обычных 8-контактных PCIe 2.0 (хорошо всем знакомых).

Отметим приличные габариты данной карты, особенно по толщине: 6,3 см. В результате видеокарта занимает 4 слота в системном блоке.

RTX 4070 Ti не обладает поддержкой мультиграфической конфигурации, то есть технологии SLI, и у карты нет специального разъема на верхнем торце.

Карта имеет стандартный набор видеовыходов: три DP 1.4a и один HDMI 2.1.

Управление работой карты обеспечивается с помощью фирменной утилиты Thunder Master.

Панель разгона позволяет настроить частоты работы карты, а также задать авторазгон

Панель управления вентиляторами: три вентилятора поделены на 2 блока (2 крайних +1 центральный), ими можно управлять раздельно

Панель мониторинга состояния карты

Нагрев и охлаждение

В целом концепция СО у этой карты соответствует той, что рекомендовала Nvidia при выпуске серии RTX 30: компактная PCB и система охлаждения, продувающая крайним вентилятором радиатор насквозь. Собственно, инженеры Palit даже усилили такой вариант: основой кулера является огромный многосекционный пластинчатый никелированный радиатор с тепловыми трубками, распределяющими тепло по ребрам радиатора. Трубки припаяны к огромному медному плато (подошве). Испарительной камеры в данном случае нет, просто сама подошва весьма толстая.

Микросхемы памяти и преобразователи питания VRM охлаждаются с помощью этой же огромной подошвы (через термопрокладки).

Задняя пластина участвует в охлаждении оборотной стороны платы через термопрокладки, а также служит элементом защиты и усиления жесткости PCB. Концепция в целом предусматривает тройную защиту печатной платы от любых повреждений и изгибов: кроме задней пластины имеется еще и черная рама, связывающая ее с радиатором охлаждения, а также с крепежной планкой, создавая этакий монолитный каркас вокруг PCB.

Поверх радиатора установлен кожух, покрывающий три вентилятора ∅95 мм.

Остановка вентиляторов при малой нагрузке видеокарты происходит, если температура GPU опускается ниже 50 градусов, а нагрев микросхем памяти — ниже 80 градусов. При запуске ПК вентиляторы работают, однако после загрузки видеодрайвера идет опрос рабочей температуры, и они выключаются. Ниже есть видеоролик на эту тему.

Мониторинг температурного режима с помощью MSI Afterburner:

Режим BIOS 1(P):

После 2-часового прогона под нагрузкой максимальная температура ядра не превысила 68 градусов, а температура микросхем памяти — 75 градусов, что является великолепным результатом для видеокарт такого уровня! Энергопотребление карты доходило до 293 Вт. Напомним, что безопасный предел нагрева памяти GDDR6X — 105 °C.

Режим BIOS 2(S):

В этом случае максимальная температура ядра достигала 69 градусов, а микросхем памяти — 76 °C, что также является отличным результатом для видеокарт такого уровня. Энергопотребление карты почти не изменилось (293 Вт).

При ручном разгоне (режим BIOS 1(P)) при выставлении лимита потребления в 112% параметры нагрева и шума менялись мало: максимальная температура ядра достигала 70 градусов, памяти — 77 градусов, потребление вырастало до 315 Вт.

Мы засняли и ускорили в 50 раз 8-минутный прогрев (BIOS 1(P)):

Максимальный нагрев наблюдался около блока VRM и микросхем памяти.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума следующая:

менее 20 дБА: условно бесшумно
от 20 до 25 дБА: очень тихо
от 25 до 30 дБА: тихо
от 30 до 35 дБА: отчетливо слышно
от 35 до 40 дБА: громко, но терпимо
выше 40 дБА: очень громко

В режиме простоя в 2D в обоих режимах BIOS температура была не выше 42 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось.

Режим BIOS 1(P):

В режиме максимальной нагрузки в 3D температура достигала 68/75 °C (ядро/память). Вентиляторы при этом раскручивались до 1707 оборотов в минуту, шум вырастал до 32,5 дБА: это отчетливо слышно, но еще не громко. В видеоролике ниже можно оценить, как вырастает шум (он фиксировался на пару секунд через каждые 30 секунд).

Режим BIOS 2(S):

В режиме максимальной нагрузки в 3D температура достигала 69/77 °C (ядро/память). Вентиляторы при этом раскручивались до 1570 оборотов в минуту, шум вырастал до 30,8 дБА: это тот же уровень, немного тише. В видеоролике ниже это продемонстрировано (шум фиксировался на пару секунд через каждые 30 секунд).

В целом относительно тихая работа системы охлаждения заслуживает похвалы.

Подсветка

Карта Palit имеет СО, доставшуюся ей «по наследству» от RTX 3090 Ti, так что мы видим хорошо знакомую нам по картам 30-й серии подсветку практически по всей площади кожуха СО, где установлены несколько десятков адресуемых светодиодов под акриловым покрытием характерного и запоминающегося вида.

Также на верхнем торце карты подсвечены логотипы серий.

Это не новый тип подсветки, такой дизайн появился в 2020 году с выходом RTX 30 в серии GameRock. Управление режимами подсветки, в том числе и ее отключением, осуществляется той же утилитой ThunderMaster.

Имеется возможность сохранения выбранного режима в самой карте, то есть при

Полный текст статьи читайте на iXBT прочитано 51518 раз