30.05.2023
Как увеличить продажи в автосалоне в 2 раза с помощью сквозной аналитики

30.05.2023
Мобильное приложение клиники "Энергетик"

30.05.2023
Кофемашина Red RCM-1540: несколько программ для черного кофе и ручной капучинатор

30.05.2023
Как сделать так, чтобы тебя все узнавали?

30.05.2023
Нестареющие тренды в дизайне интерьера

30.05.2023
Видеоускоритель Nvidia GeForce RTX 4060 Ti (8 ГБ): теория и архитектура, описание карты Palit, синтетические и игровые тесты (включая тесты с трассировкой лучей), выводы

30.05.2023
Когда в России появятся собственные Open Source продукты

30.05.2023
Сила — в технологиях. Что придумала Huawei для компьютеров и планшетов: 4 фирменных разработок

30.05.2023
Что вы получите при покупке самого доступного смартфона со складным экраном

30.05.2023
Kubernetes и микросервисная архитектура: как лучше действовать заказчикам сегодня? Мнение 144 компаний, опрошенных CNews

30.05.2023
Как создать портфолио начинающему дизайнеру интерьера

Видеоускоритель Nvidia GeForce RTX 4060 Ti (8 ГБ): теория и архитектура, описание карты Palit, синтетические и игровые тесты (включая тесты с трассировкой лучей), выводы30.05.2023 16:01

Общая информация о GeForce RTX 4060 Ti

При анонсе графической архитектуры Ada Lovelace в прошлом году компания Nvidia рассказала о трех видеокартах на ее основе: флагманской модели GeForce RTX 4090 и паре вариантов RTX 4080, один из которых затем переименовали в RTX 4070 Ti. Видеокарты выпускались на рынок постепенно, и мы успели рассмотреть их все, а совсем недавно была анонсирована еще пара видеокарт среднего ценового диапазона: GeForce RTX 4060 Ti и модель с таким же цифровым индексом без приставки. Первая в варианте с 8 ГБ видеопамяти по цене $399 уже вышла и даже продается, а модель с 16 ГБ (она будет сразу на сотню долларов дороже) и простая RTX 4060 с необъявленной пока ценой появятся в продаже в июле.

Сегодня мы рассмотрим только первую из них — GeForce RTX 4060 Ti с 8 ГБ памяти. Новая модель использует все самые современные технологии компании Nvidia, включая последние версии RT-ядер и тензорных ядер, которые мощнее предыдущих и поддерживают новые возможности, вроде технологии DLSS 3 и Shader Execution Reordering, и при этом ее GPU потребляет меньше энергии по сравнению с прямой предшественницей — RTX 3060 Ti. Ее основное преимущество перед соперниками как AMD, так и GeForce предыдущих поколений за те же деньги — в поддержке технологии генерации кадров DLSS 3, которая раньше была доступна только в GPU более высокой ценовой категории.

Главное нововведение DLSS 3 заключается в создании дополнительных интерполированных кадров на основе пары существующих, для чего используется специализированный аппаратный движок Optical Flow Accelerator, интерполирующий соседние кадры и создающий на их основе новые. Но даже без учета этого мощности RTX 4060 Ti вполне достаточно для того, чтобы обеспечить высокую частоту кадров при Full HD-разрешении и максимальных или очень высоких графических настройках в таких ресурсоемких играх, как Cyberpunk 2077, Microsoft Flight Simulator и многих других.

Nvidia систематически внедряла графическую архитектуру Ada Lovelace в своей линейке и шла сверху от флагманских решений вниз к среднебюджетным. Начинали они с RTX 4090 и RTX 4080, затем переходя к производительному сегменту с RTX 4070 Ti и RTX 4070, а теперь вот и к среднему ценовому диапазону с видеокартами RTX 4060 Ti и RTX 4060.

Nvidia позиционирует свою текущую линейку определенным образом. Если модели GeForce RTX 4090 и RTX 4080 предназначены для разрешения 4K при всех максимальных графических настройках, вместе с трассировкой лучей, а также для полупрофессионального использования в ПО для создания цифрового контента и средств, использующих возможности нейросетей, то GeForce RTX 4070 Ti и RTX 4070 уже обеспечат максимум графики лишь в разрешении 2560×1440, хотя без трассировки лучей их вполне хватит и для 4K. Ну, а анонсированные недавно GeForce RTX 4060 Ti и RTX 4060 годятся уже только для Full HD-разрешения, если говорить о самых современных играх.

И в этом нет ничего странного, ведь это самые популярные категории среди игроков. Во-первых, судя по статистике аппаратного обеспечения в сервисе Steam, около 80% пользователей имеют видеокарты этого уровня и слабее (но более старые, разумеется): GTX 1060, GTX 1660, RTX 2060 и так далее. И почти столько же — 77% пользователей сервиса — имеют Full HD-мониторы и играют в разрешении 1920×1080 или даже ниже. Именно для них Nvidia и выпустила две видеокарты новой подсерии RTX 4060 — с приставкой Ti и без нее. Специалисты компании полагают, что эти модели могут стать неплохим вариантом для модернизации видеосистемы для владельцев старого железа. Сегодня мы попробуем разобраться, так ли это.

Графическая архитектура Ada Lovelace во многом схожа с архитектурой Ampere, на которой основаны различные модификации чипов GA10x, обе эти архитектуры имеют достаточно много общего и с предыдущими архитектурами Turing и Volta, и перед прочтением материала будет полезно ознакомиться с нашими предыдущими статьями по теме:

Графический ускоритель GeForce RTX 4060 Ti
Кодовое имя чипа	AD106
Технология производства	5 нм (TSMC 4N)
Количество транзисторов	22,9 млрд (35,8 млрд у AD104)
Площадь ядра	190 мм² (294,5 мм² у AD104)
Архитектура	унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти	128-битная: 4 независимых 32-битных контроллера памяти с поддержкой памяти типа GDDR6
Частота графического процессора	до 2535 МГц
Вычислительные блоки	34 (из 36) потоковых мультипроцессора, включающих 4352 (из 4608) CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64
Тензорные блоки	136 (из 144) тензорных ядер для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32
Блоки трассировки лучей	34 (из 36) RT-ядра для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования	136 (из 144) блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP)	6 широких блоков ROP на 48 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов	поддержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a)

Спецификации видеокарты GeForce RTX 4060 Ti
Частота ядра	2310/2535 МГц
Количество универсальных процессоров	4352
Количество текстурных блоков	136
Количество блоков блендинга	48
Эффективная частота памяти	18 ГГц
Тип памяти	GDDR6
Шина памяти	128 бит
Объем памяти	8 ГБ
Пропускная способность памяти	288 ГБ/с
Вычислительная производительность (FP32)	до 22,1 терафлопс
Теоретическая максимальная скорость закраски	122 гигапикселя/с
Теоретическая скорость выборки текстур	345 гигатекселей/с
Шина	PCI Express 4.0 x8
Разъемы	по выбору производителя
Энергопотребление	до 160 Вт
Дополнительное питание	по выбору производителя
Число слотов, занимаемых в системном корпусе	по выбору производителя
Рекомендуемая цена	$399

Название новой модели соответствует принятому принципу наименования решений компании. Новинка на основе слегка урезанного чипа AD106 заняла свое положение в линейке на ступень ниже RTX 4070, как и должно быть исходя из применяемых графических процессоров, а ниже ее будет такая же модель без приставки Ti, которая появится в июле.

Nvidia оценила модель GeForce RTX 4060 Ti с 8 ГБ видеопамяти в $399 на рынке США, и это соответствует рекомендованной цене предшественника — RTX 3060 Ti. За эту цену на рынке настольных видеокарт свежих конкурентов у AMD пока что нет, так как младшая из пары топовых видеокарт AMD Radeon RX 7900 XT является конкурентом RTX 4070 Ti и стоит заметно дороже, а RX 7600 и дешевле и менее мощная. Так что сравнивать RTX 4060 Ti сегодня придется скорее с теми видеокартами прошлого, которые продаются по схожей цене: RX 6750 XT и RX 6800. Пока что ничего нового из текущего поколения AMD в этом ценовом диапазоне даже не анонсировала.

Рекомендуемую цену у RTX 4060 Ti не назвать низкой, но по нашим временам надеяться на меньшее было бы странно — дорожает абсолютно всё. А тут цена осталась как у RTX 3060 Ti, но зато увеличение производительности оставляет желать лучшего. С точки зрения покупателя всё понятно — шаг с RTX 3060 Ti и RTX 3070 недостаточно велик, чтобы выбирать именно RTX 4060 Ti. А вот с точки зрения Nvidia всё объяснимо. Рынок видеокарт сильно просел — и из-за общего состояния рынка и из-за конца майнингового бума. Продавать видеокарты в тех же количествах сейчас просто некому, поэтому пришлось искать другие методы, чтобы оставить прибыль на приемлемом уровне. Вот они и решили продавать меньше видеокарт, зато дороже. Учитывая сложившиеся рыночные условия, Nvidia выставила такую цену, которая позволит им продать не слишком много GPU, но недешево. Конечно, цена в $350 казалась бы для многих более приемлемой, но принесло ли бы такое снижение соответствующий рост объема продаж для компенсации пониженной прибыли с каждой видеокарты?

К сожалению, сложившаяся на рынке ситуация может привести к тому, что многие выберут для игр вовсе не ПК, а игровые консоли, которые продаются за аналогичную цену и точно дадут стабильную игру даже в 4K (условно, конечно, потому что зачастую там используется масштабирование) без каких-то проблем, с которыми они встречаются на ПК. А может соперничающие с Nvidia компании не дадут игрокам убежать на консоли? Конкуренцию для RTX 4060 Ti составляют такие решения AMD, как Radeon RX 6750 XT и RX 6800 — первая видеокарта продается дешевле и имеет несколько меньшую производительность, если не брать трассировку лучей (а в этом ценовом сегменте ее можно и не учитывать), а также 12 ГБ, а вторая пусть и дороже, но чуть производительнее и имеет еще больше видеопамяти. Правда, и она уступает в трассировке лучей и не имеет ничего похожего на DLSS 3. Возможно, потенциальным покупателям стоит присмотреться к RTX 3070 за примерно те же деньги — скорости будет побольше в среднем, хотя поддержки DLSS 3 в этом случае также не будет.

Про объем видеопамяти у новинки мы еще подробно поговорим далее, но из-за ширины шины в 128-бит у них был выбор между 8 ГБ и 16 ГБ, и Nvidia решила выпустить оба варианта — модель с большей емкостью видеопамяти выйдет на рынок позднее. Но на самом деле, для этого уровня производительности и 8 ГБ могут быть вполне достаточными на данный момент, если не стараться задирать на максимум абсолютно все настройки качества — это же не флагманский продукт. В редких играх может наблюдаться нехватка 8 ГБ видеопамяти, но чаще всего она вызвана плохой оптимизацией при портировании с консолей и плохим менеджментом ресурсов.

Ограничение потребления энергии у RTX 4060 Ti установлено на уровне 160 Вт, и для питания видеокарт новой модели не обязательно использовать новый 16-контактный разъем питания PCIe 5.0, ставший стандартом для ATX 3.0. С учетом передаваемых по разъему PCIe 75 Вт, может быть достаточно лишь одного привычного 8-контактного разъема для дополнительного питания видеокарты, но конкретные производители видеокарт могут считать иначе и установить два таких разъема — для большей стабильности.

К слову, если продолжать рассказывать о преимуществах новинки, то Nvidia заметно улучшила энергоэффективность видеокарт серии GeForce RTX 40, и модель RTX 4060 Ti тут не исключение. При максимальном уровне потребления в 160 Вт, требования к блоку питания по современным меркам минимальны — с этим практически любой БП справится. А энергоэффективность (производительность на ватт) у новинки и вовсе одна из лучших на рынке.

GeForce RTX 4060 Ti существует также и в виде Founders Edition. Вариант исполнения самой Nvidia сохранил двухвентиляторную сквозную конструкцию системы охлаждения Founders Edition последних поколений. Эффективность охлаждения хорошая, кулер очень похож на систему охлаждения RTX 4070 FE, за исключением некоторых внешних деталей. Холодный воздух поступает от одного вентилятора, проходит через радиаторы и выбрасывается вторым вентилятором. На видеокарте Founders Edition используется новый 16-контактный разъем питания ATX 12VHPWR, который упрощает подключение питания, но имеет свои недостатки. Впрочем, в случае не слишком мощной видеокарты они проявиться не должны. Для подключения старых БП в поставке есть переходник, преобразующий питание с двух привычных 8-контактных разъемов PCIe.

Кстати, как и некоторые другие модели видеокарт из этого ценового диапазона, RTX 4060 Ti получила лишь восемь линий PCI Express 4.0, хотя у предшественницы RTX 3060 Ti их было вдвое больше. Конечно, при использовании современных игровых систем с поддержкой PCIe 4.0, значимого влияния на скорость рендеринга это не окажет, но при работе в режиме PCIe 3.0 на некоторых старых системах отрицательное влияние на производительность вполне может оказаться ощутимым. А ведь многие вполне актуальные системы не имеют поддержки PCIe 4.0, к примеру, это процессоры Intel Comet Lake-S и десктопные APU серий AMD Ryzen 4000 и 5000. Конечно, как у AMD Radeon RX 6500 XT с поддержкой лишь четырех линий PCIe у RTX 4060 Ti не будет, но некоторое падение производительности вполне возможно.

Особенности архитектуры

В линейке видеокарт GeForce RTX 40 применяются графические процессоры AD10x, основанные на графической архитектуре Ada Lovelace. Инженеры компании Nvidia спроектировали графическую архитектуру, которая не только повысила производительность операций трассировки лучей и машинного вычисления на тензорных ядрах, но и предоставила некоторые новые возможности, позволяющие улучшить эффективность, также заметно повлиял переход на современный технологический процесс тайваньской компании TSMC, позволивший разместить в чипах большое количество исполнительных блоков. Новые GPU получились заметно более сложными, но при этом они работают на высокой тактовой частоте по сравнению с решениями предыдущих серий.

Модель GeForce RTX 4060 Ti основана на графическом процессоре AD106, который производится на фабриках TSMC с использованием специализированного техпроцесса 4N — 5-нанометрового, несмотря на название. Чип уже известен нам по мобильной графике RTX 4070 Laptop, где графический процессор применяется в своей максимальной конфигурации. Чип AD106 включает в себя все возможности и особенности флагманского решения AD102, включая RT-ядра третьего поколения и тензорные ядра четвертого — то есть поддерживает все улучшения трассировки лучей, а также технологию увеличения производительности DLSS 3 и новый ускоритель оптического потока OFA.

Графический процессор AD106 имеет приличное количество транзисторов — 22,9 млрд., что почти вдвое больше, чем GA106 из предыдущего поколения, и даже почти на треть больше, чем есть у GA104. А по производительности AD106 вполне можно сравнить с TU102 (RTX 2080 Ti), состоящем из 18,6 млрд. транзисторов — «лишние» транзисторы AD106 ушли на дополнительную кэш-память второго уровня в Ada, а также все улучшения CUDA-ядер, RT-ядер и тензорных ядер за пару поколений графических архитектур Nvidia.

Как и все графические процессоры компании Nvidia, чип AD106 состоит из укрупненных кластеров Graphics Processing Cluster (GPC), которые включают несколько кластеров текстурной обработки Texture Processing Cluster (TPC), содержащих потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации ROP и контроллеры памяти. Как и в предыдущих архитектурах, кластер GPC самостоятельно производит все основные вычисления внутри кластера, и включает свой движок растеризации Raster Engine, шесть кластеров TPC, состоящих из 12 мультипроцессоров SM.

Графический процессор AD106 имеет три кластера обработки графики GPC, они содержат по шесть кластеров обработки текстур TPC, каждый из которых имеет по два потоковых мультипроцессора SM. Каждый мультипроцессор, в свою очередь, содержит по 128 CUDA-ядер в четырех разделах. Половина из них умеют вычислять данные в формате FP32, а другие поддерживают FP32 или INT32 — есть возможность параллельной обработки FP32 и INT32. Каждый мультипроцессор SM также содержит RT-ядро третьего поколения, четыре тензорных ядра четвертого поколения, кэш-память и четыре текстурных блока TMU.

В полной версии чипа AD106 есть три GPC, содержащих 4608 CUDA-ядер, 144 блоков TMU, 144 тензорных ядер и 36 RT-ядер. В каждом GPC есть по 16 ROP, и всего в чипе содержится 48 ROP. Но модель видеокарты GeForce RTX 4060 Ti основана на урезанной версии AD106, в которой отключен один кластер TPC в одном из GPC. Так что в данном варианте GPU содержится 4352 активных CUDA-ядра, 136 тензорных ядер, 34 RT-ядра и 136 текстурных модуля TMU. А вот количество ROP осталось полным — 48 штуки. Самым интересным и спорным моментом RTX 4060 Ti и AD106 является объем и шина памяти — это те же 8 ГБ, что и RTX 3060 Ti из предыдущего поколения, да еще при вдвое более узкой шиной памяти — всего лишь 128-бит.

Аналогичная видеокарта из предыдущего поколения GeForce RTX 3060 Ti имеет 256-битный интерфейс GDDR6-памяти с теми же 8 ГБ памяти при общей пропускной способности в 448 ГБ/с — что заметно выше, чем 288 ГБ/с у рассматриваемой GeForce RTX 4060 Ti, использующей вдвое более узкий 128-битный интерфейс памяти. Но у Nvidia есть объяснение своему решению — в новой архитектуре Ada Lovelace они попытались перебалансировать подсистему памяти, чтобы можно было применять более узкую шину памяти, заметно увеличив объем кэш-памяти на кристалле — их конкурент сделал примерно то же самое чуть раньше. Из преимуществ решения (для Nvidia) — снижение себестоимости, из недостатков (для пользователей) — потенциальная нехватка пропускной способности, что может вызвать снижение производительности в некоторых случаях. Но так как L2-кэш на порядок быстрее видеопамяти по задержкам, то больший его объем для часто используемых данных может дать и преимущество в некоторых случаях.

Изменения подсистемы памяти архитектуры Ada Lovelace

Для того, чтобы улучшить эффективную пропускную способность памяти, в архитектуре Ada Lovelace используется измененная подсистема кэширования с большим объемом кэш-памяти второго уровня. Так, в RTX 4060 Ti есть 32 МБ L2-кэша, в отличие от лишь 4 МБ у RTX 3060 Ti из предыдущего семейства. Дополнительный кэш должен снизить задержки доступа к памяти и улучшить эффективную пропускную способность, ведь GPU будет реже обращаться к локальной видеопамяти за данными. Также это дополнительно улучшает общую энергоэффективность.

Подсистема памяти в архитектуре Ada несколько отличается от того, что мы видели в предыдущих архитектурах компании. Все GPU новой архитектуры имеют заметно больший объем кэш-памяти второго уровня по сравнению с предыдущими семействами. Так, AD106 имеет L2-кэш объемом 32 МБ, что снижает передаваемый по шине памяти объем данных и обеспечивает лучшее сочетание производительности и потребления энергии. В графических процессорах семейства Ampere и всех предыдущих, объем L2-кэша был не слишком большим, и они должны были иметь высокую пропускную способность памяти, чтобы получать необходимый объем данных.

Напомним, что система кэширования данных GPU состоит из двух уровней: кэша данных первого уровня (L1) и второго (L2). Каждый мультипроцессор SM включает кэш данных первого уровня — он отличается очень низкой задержкой доступа, так как расположен рядом с вычислительными ядрами, и GPU ищет необходимые данные именно там. Но L1-кэш не может быть слишком большим, так как он располагается максимально близко к ядрам. И если необходимые данные не найдены в L1-кэше, то GPU запрашивает второй уровень кэша данных — L2. Эта подсистема также находится на самом кристалле GPU и подключается через высокоскоростные каналы данных к кластерам обработки графики GPC, каждый из которых содержит по несколько мультипроцессоров SM (см. диаграмму графического процессора). Если нужная информация есть в уже куда более объемном L2-кэше (попадание кэша), то эти данные довольно быстро и эффективно передаются вычислительным ядрам. А вот если данных нет и в L2-кэше (промах кэша), то GPU должен получить их по шине памяти во внешней видеопамяти, которая куда медленнее. Каждый промах кэш-памяти приводит к снижению производительности и эффективности.

И тут мы переходим к одному из важных нововведений подсистемы памяти графических процессоров архитектуры Ada — увеличенный L2-кэш. По сравнению Ampere, в Ada в несколько раз больший объем L2-кэша. Если сравнивать RTX 4060 Ti и RTX 3060 Ti, то в 8 раз, а если сравнивать GPU с 128-битной шиной памяти, то и 16 раз. Кроме этого, пропускная способность L2-кэша в графических процессорах Ada была еще и значительно увеличена, что также позволяет быстрее передавать большие объемы данных между кэшем и вычислительными ядрами. В итоге изменения привели к большему количеству попаданий в кэш второго уровня, что снизило передачу данных из локальной видеопамяти.

Для сравнения эффективности увеличенного L2-кэша Nvidia привела данные RTX 4060 Ti с 32 МБ L2-кэша и специальной версией такой же видеокарты со всего лишь 2 МБ кэша — как в 128-битных графических процессорах предыдущего поколения с 512 КБ L2-кэша на каждый 32-битный контроллер памяти. Как видно на иллюстрации, наличие 32 МБ кэша снизило передачу данных из памяти на 40%—60% по сравнению с вариантом с 2 МБ. А среднее сокращение трафика на 50% позволяет GPU использовать пропускную способность памяти вдвое эффективнее, и в результате всех улучшений графический процессор в RTX 4060 Ti с пропускной способностью памяти в 288 ГБ/с демонстрирует вдвое бо́льшую эффективную производительность — 554 ГБ/с (теоретический показатель). В общем, увеличенный объем кэша в Ada повышает производительность и улучшает общую энергоэффективность — при необходимости использовать более узкую шину памяти.

Что касается объема видеопамяти «всего лишь» в 8 ГБ — да, это столько же, что и у RTX 3060 Ti в прошлом поколении, хотя прошло уже два года. Многие утверждают, что 8 ГБ уже слишком мало и невозможно играть с этим количеством видеопамяти, а нужно минимум 12 ГБ. Конечно же, это не так. Для начала, нужно правильно оценивать потребности игр в объеме видеопамяти. Применять показатели «использования видеопамяти» в инструментах измерения производительности некорректно — это число означает скорее занятый объем видеопамяти, а не используемый. А игры и игровые движки работают по-разному, некоторые выделяют куда больший объем памяти себе, чем используют. Часто движки просто забивают имеющийся объем памяти даже если им это не нужно, запрашивая больше памяти по возможности. И точно узнать, сколько конкретно видеопамяти нужно, на деле просто невозможно, да и это значение постоянно меняется от кадра к кадру. Проще всего оценивать такие параметры частоты кадров как минимальная частота кадров или минимальная частота кадров для 0,1% (или 1%) худших кадров.

Конечно, лучше бы RTX 4060 Ti имела больше видеопамяти, с этим никто не спорит. Но на нее физически невозможно поставить что-то среднее между 8 ГБ и 16 ГБ, а второй вариант будет скоро доступен. Но для подавляющего большинства игр в разрешении Full HD, даже 8 ГБ будет вполне достаточно, а большее количество видеопамяти ничего не даст. Да, некоторые новые игры, такие как Hogwarts Legacy, Resident Evil 4, The Last of Us Part I и Star Wars Jedi: Survivor могут выделять очень много видеопамяти, но это еще не означает, что эти данные постоянно используются каждый кадр. Случаи нехватки 8 ГБ найти можно, но для GPU такого ценового уровня вполне нормально ставить качество текстур на высокое, а не ультра, и тогда всё будет в полном порядке. Ну, а если вам всё же хочется больше памяти, то ждите RTX 4060 Ti 16 ГБ вариант в июле — посмотрим, сколько покупателей захочет заплатить лишние $100 за мнимые улучшения производительности и потенциал на будущее.

А почему на первый вариант RTX 4060 Ti вообще установили именно 8 ГБ видеопамяти, а не больше? Выпускаемые чипы GDDR6X- и GDDR6-памяти поставляются в виде 8 Гбит (1 ГБ) и 16 Гбит (2 ГБ) микросхем. Каждый чип может использовать два отдельных 16-битных канала памяти для подключения к 32-битному контроллеру памяти, или два 8-битных канала, чтобы две микросхемы подключились к одному 32-битному контроллеру. Так что к GPU с 128-битной шиной памяти (четыре 32-битных контроллера) можно присоединить или четыре или восемь чипов памяти. Смешивать чипы разной плотности в принципе возможно, но имеет свои недостатки. Так что для простоты будем считать, что по 128-битной шине можно получить 4 ГБ, 8 ГБ или 16 ГБ, но не 10 ГБ или 12 ГБ, к примеру. В модели GeForce RTX 4060 Ti с 8 ГБ используются четыре микросхемы GDDR6-памяти по 16 Гбит, а в 16 ГБ модели — восемь таких же чипов.

Остальные архитектурные улучшения семейства Ada Lovelace были разобраны нами в теоретическом обзоре, там же подробно описаны все изменения в RT-ядрах новой архитектуры, включая аппаратные блоки Opacity Micromap Engine и Displaced Micro-Mesh Engine, а также дополнительный планировщик для изменения порядка выполнения шейдеров Shader Execution Reordering, позволяющие повысить эффективность аппаратной трассировки лучей.

Осталось вкратце упомянуть возможности GeForce RTX 4060 Ti по работе с видеоданными. Они не отличаются от таковых у других моделей серии — в специализированном аппаратном кодировщике NVEnc восьмого поколения появилась поддержка кодирования видео в формате AV1, кодировщик AV1 в Ada на 40%-50% эффективнее кодировщика H.264, используемого в графических процессорах предыдущей серии, и новый формат AV1 позволит увеличить разрешение видеопотока при стриминге с 1080p до 1440p при том же битрейте. Все представленные графические процессоры Ada имеют по два аппаратных кодировщика NVEnc на борту, что позволяет кодировать видеоданные с разрешением 8K при 60 FPS или сразу четыре видеопотока разрешения 4K при 60 FPS — и при этом быстрее, чем на RTX 3090 Ti.

Кроме NVEnc, в графические процессоры архитектуры Ada включен аппаратный декодер пятого поколения NVDec, который появился в Ampere. Он поддерживает декодирование видеоданных с аппаратным ускорением в форматах: MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 и AV1. Также полностью поддерживается и декодирование видеоданных в разрешении 8K при 60 FPS.

Предварительная оценка производительности

Одним из явных преимуществ GeForce RTX 4060 Ti перед аналогичными по мощности GPU предыдущего поколения и конкурирующими решениями AMD является поддержка генерации (интерполяции) кадров в составе технологии DLSS 3, которой лишены все видеокарты RTX 30. За счет этого RTX 4060 Ti может обеспечить большую частоту кадров даже по сравнению с более мощными видеокартами серии RTX 30. В режиме рендеринга с трассировкой пути, появившемся наконец-то в игре Cyberpunk 2077, эта видеокарта сможет обеспечить комфортную игру именно вместе с DLSS 3, пусть и в невысоком разрешении.

Технология генерации промежуточных кадров DLSS 3 появилась в нынешнем поколении GeForce RTX 40 и уже поддерживается в нескольких десятках игр и приложений (вместе с еще не вышедшими, но уже анонсированными их около 50 штук), большая часть из которых также поддерживают и трассировку лучей. Практически все они обеспечивают приемлемый комфорт при игре в Full HD-разрешении и на GeForce RTX 4060 Ti, и количество игр с поддержкой технологии постоянно растет.

Те разработчики игр, которые использовали специализированный пакет Nvidia Streamline SDK для внедрения DLSS 2, с легкостью смогли интегрировать в свои проекты и DLSS 3, включая все компоненты технологии: масштабирование разрешения (что мы знаем как DLSS 2), генерацию промежуточных кадров (известна как DLSS 3) и технология снижения задержек, работающая совместно с предыдущими — Reflex. Более того, поддержка DLSS 3 скоро появится в самом популярном движке Unreal Engine 5.2. Еще в феврале 2021 года разработчики компании Nvidia выпустили бесплатный плагин для внедрения DLSS 2 в Unreal Engine, и он сделал добавление технологии в проекты, использующие этот движок, весьма простым. Теперь компания обещает релиз DLSS 3 в Unreal Engine Marketplace для версии движка Unreal Engine 5.2, что позволит получить доступ к технологии всем разработчикам, использующим Unreal Engine.

Что касается производительности, то вот данные Nvidia о среднем приросте частоты кадров от включения DLSS 3 в 18 игровых проектах на ПК с Intel Core i9–12900K в разрешении Full HD, при включенной трассировке лучей там, где она поддерживается. Если без учета генерации кадров увеличение частоты кадров составляет не слишком впечатляющие 15% при сравнении с RTX 3060 Ti, то с DLSS 3 будет уже 1,7 раза. Сравнение довольно спорное, не всем нравится DLSS, поэтому перейдем к сравнению теоретических показателей видеокарт, что позволит оценить потенциальную разницу между решениями разных поколений.

С точки зрения теоретических показателей всё вроде бы неплохо — и шейдерная производительность у новинки значительно выше, и производительность трассировки лучей и тензорных ядер. Но это — лишь пиковые показатели в определенных условиях. В большинстве игр же все эти решения будут друг к другу куда ближе. Тем более, что по пропускной способности памяти новинка даже отстает, хотя эффективная ПСП у нее вроде как выше (это мы проверим далее). А вот по какому параметру точно есть преимущество, так это по сниженному потреблению энергии, а вместе с ним и повышенной энергоэффективности. Тут вопросов нет, новинка значительно лучше решений предыдущих поколений.

Что касается производительности в играх, то GeForce RTX 4060 Ti предлагает скорость рендеринга где-то между RTX 3060 Ti и RTX 3070 с возможностью дополнительного увеличения частоты кадров в играх с поддержкой технологии DLSS 3. На системе с процессором Intel Core i9–12900K в Full HD-разрешении при максимальных настройках и с включенными трассировкой лучей и DLSS в играх с их поддержкой, новая модель показывает следующую производительность относительно своих предшественниц: RTX 3060 Ti и RTX 2060 Super (по данным Nvidia):

По производительности RTX 4060 Ti располагается примерно между RTX 3070 и RTX 3060 Ti. В играх, где применяется трассировка лучей, новинка ближе к RTX 3070, а в менее продвинутых графически — к младшей модели предыдущего поколения. Многие ожидали большего прироста производительности по отношению к линейке RTX 30 — по ожиданиям, хотя бы RTX 3070 должна была оставаться позади всегда, чтобы переход с младших видеокарт прошлого поколения имел смысл. Но Nvidia в целом и не позиционирует RTX 4060 Ti как продукт для таких покупателей, эта видеокарта ориентирована на владельцев устаревших игровых ПК на основе среднебюджетных моделей GTX 10, GTX 16 и младших видеокарт серии RTX 20.

В среднем при Full HD-разрешении в современных играх с использованием трассировки лучей, GeForce RTX 4060 Ti почти равна с RTX 3070 предыдущего поколения и аналогична еще более старой RTX 2080 Ti. Но прирост производительности от поколения к поколению очень невелик — около 15%, это заметно меньше того, что дали старшие модели линейки GeForce RTX 40 по сравнению с аналогами из RTX 30. Если сравнивать с AMD Radeon, то новая RTX 4060 Ti превосходит по скорости Radeon RX 6750 XT, а в некоторых играх с трассировкой она быстрее RX 6800 и даже RX 6800 XT. В Full HD-разрешении и при максимальных настройках, GeForce RTX 4060 Ti обычно достигает 60 кадров в секунду и более практически во всех играх, кроме самых требовательных. Новинка также вполне способна запускать многие игры и в разрешении 2560×1440, но иногда может потребоваться некоторое снижение настроек.

Наиболее важным преимуществом GeForce RTX 4060 Ti является поддержка генерации промежуточных кадров DLSS 3 — алгоритм создает дополнительный кадр на основе двух соседних по перемещению объектов в них. Если просматривать видеозапись замедленно и искать попиксельно, то некоторые проблемы и артефакты заметить можно, но при обычной игре вы вряд ли заметите какую-либо разницу, особенно при высоком FPS и разрешении, но только когда задержка не слишком велика. Возможность увеличить частоту кадров почти бесплатно — отличная возможность, с ее помощью можно включить ту же ресурсоемкую трассировку лучей или просто максимальные настройки качества. Единственный недостаток — количество игр с поддержкой DLSS 3, их пока что менее 50 штук. Зато ничего похожего у соперников до сих пор нет, хотя AMD и заявляли о разработке FSR 3, но мы не видели даже соответствующих демонстраций.

RTX 3060 Ti вышла два года назад, имела такую же цену в $399 и получила отличное соотношение цены и производительности для своего времени. И через два года Nvidia выпустила лишь чуть более производительную RTX 4060 Ti по той же рекомендованной цене и даже с тем же объемом видеопамяти. Так что вполне можно понять тех, кто был разочарован столь небольшим приростом производительности, если не учитывать улучшенную энергоэффективность и технологию генерации кадров DLSS3, конечно же. Но если сравнивать RTX 4060 Ti с существующими на рынке продуктами, то эта видеокарта не так уж плоха — она точно лучше аналогов в своем классе, и по производительности и по энергоэффективности.

Другое дело, что ожиданиям потенциальных покупателей этот уровень не совсем соответствует, и тут нужно вспомнить, что рынок есть рынок и он отреагирует соответствующим образом — если спрос будет ниже ожидаемого уровня, то Nvidia придется снижать цены, и это может сделать RTX 4060 Ti более интересным вариантом для покупки. Хотя модель RTX 3070 нужно было опережать во всех условиях, конечно же. На этом с теоретической частью мы закончили и переходим к рассмотрению практических особенностей видеокарты GeForce RTX 4060 Ti в исполнении компании Palit.

Особенности карты Palit GeForce RTX 4060 Ti Dual 8 ГБ

Сведения о производителе: Компания Palit Microsystems (торговая марка Palit) основана в 1988 году в Китайской Республике (Тайвань). Штаб-квартира — в Тайбэе/Тайвань, крупный центр по логистике — в Гонконге, второй офис (по продажам в Европе) — в Германии. Фабрики — в Китае. На рынке в России — с 1995 года (начинались продажи как безымянных продуктов, так называемых Noname, а под маркой Palit продукты начали идти только после 2000 года). В 2005 году компания приобрела торговую марку и ряд активов Gainward (после, по сути, банкротства одноименной компании), после чего был образован холдинг Palit Group. Был открыт еще один офис в Шеньжене, направленный на продажи в Китае. На сегодня внутри Palit Group сосредоточено еще несколько торговых марок и брендов.

Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) Palit GeForce RTX 4060 Ti Dual 8 ГБ 128-битной GDDR6

Полный текст статьи читайте на iXBT