Обзор видеокарты NVIDIA GeForce GTX 1660 Ti: ближе к народу

Титульная функция новых видеокарт NVIDIA — трассировка лучей в реальном времени — уже проявила себя в первых играх, где она широко используется для формирования достоверных отражений и глобального освещения (Battlefield V и Metro Exodus), а на очереди еще несколько больших проектов, которые получат поддержку DXR (расширения API Direct3D 12 для Ray Tracing). Но среди геймеров не утихают споры о том, правильно ли поступила NVIDIA, поставив во главу угла передовые методы рендеринга вместо «сырой» производительности графических процессоров.

Те покупатели, которые не видят у трассировки лучей больших перспектив в компьютерных играх, с радостью согласились бы изъять из ускорителей GeForce RTX всю логику, обслуживающую эту функцию, в обмен на рост быстродействия в играх старого образца. Каким бы он стал — Turing без RTX? Конечно, NVIDIA не собирается выпускать аналог GeForce RTX 2080 или RTX 2080 Ti без RT-ядер специально для неверующих. С другой стороны, компании придется рано или поздно заменить всю серию GeForce 10 устройствами на основе GPU, выпущенных по технологии 12 нм. Так где же на ценовой линейке NVIDIA проведет отметку, ниже которой аппаратная трассировка лучей уже лишена практического смысла?

Теперь нам известен ответ на этот вопрос. GeForce RTX 2060 остался наиболее доступным представителем нового поколения, который обладает совместимостью с DXR, а «Тьюринги» бюджетной категории выделили в новую серию, GeForce 16, которая занимает промежуточное положение между GeForce 10 и GeForce 20. И родоначальником этой серии стал GeForce GTX 1660 Ti. Как мы помним, RTX 2060 уже оказался весьма выгодным предложением по соотношению цены и быстродействия в «старых» играх на фоне общего удорожания видеокарт NVIDIA. Посмотрим, чем продолжилось шествие архитектуры Turing — уже без RTX — в зоне ниже $300.

⇡#Графический процеcсор TU116

Для того, чтобы выпустить графическую карту на основе архитектуры Turing и прогрессивного техпроцесса 12 нм FinFET, но отбросить функции, связанные с аббревиатурой RTX (трассировку лучей и аппаратное ускорение нейронных сетей), NVIDIA пришлось создать отдельную модель графического процессора — TU116. Как ни крути, а TU106 — «младший из старших» чипов семейства Turing, уже применяется в двух ускорителях серии GeForce RTX — 2060 и 2070. Подвергнуть его дальнейшей деконструкции ради GeForce GTX 1660 Ti едва ли было бы целесообразно с экономической точки зрения.

Блок-схема TU116 производит такое впечатление, как будто никакого RTX не было и в помине, а микроархитектура Turing отличается от предшествующей Pascal лишь в части организации функциональных блоков, выполняющих традиционные функции рендеринга. Скальпель инженеров NVIDIA отсек лишь новые компоненты — тензорные и RT-ядра —, а по другим параметрам TU116 отличается от TU106 в основном количественным, нежели качественным образом. Так, наряду с CUDA-ядрами, выполняющими операции стандартной точности над числами с плавающей запятой (FP32), внутри потокового мультипроцессора (SM — Streaming Multiprocessor) TU116 есть равное количество ядер для целочисленных операций (INT32). А точнее, целочисленные и FP-ALU, объединенные внутри CUDA-ядра, в архитектуре Turing получили раздельные каналы передачи данных, и это позволяет диспетчерам команд в течение двух тактов полностью нагрузить SM операциями того и другого типа. По оценкам NVIDIA, за счет такой организации пропускная способность GPU в шейдерных расчетах может возрастать в полтора раза.

Блок-схема графического процессора NVIDIA TU116

С другой стороны, TU116 не уступает прочим чипам архитектуры Turing в способности выполнять операции половинной точности (FP16) с пропускной способностью в отношении 2:1 к операциями FP32. Это неожиданное и даже подозрительное качество для чипа, который создали специально для условно бюджетных графических карт, лишенных функций RTX. Дело вот в чем: операции FP16 в старших «Тьюрингах» выполняются силами тензорных ядер, даже если приложение напрямую не обращается к ним через API CUDA. Конечно, формат FP16 уже нашел применение в компьютерной графике для шейдерных программ, не требующих более точного представления данных, но честно говоря, трудно поверить, что NVIDIA потратила время разработчиков и площадь чипа (наверняка существенную) специально ради таких, по-прежнему маргинальных в играх на ПК, ситуаций. Двойную мощность в операциях FP16 проще объяснить тем, что тензорные ядра на самом деле есть в кремнии TU116. NVIDIA просто редуцировала их управляющую логику, либо, что более вероятно, заблокировала соответствующие вызовы API, чтобы лучше дифференцировать GeForce GTX 1660 Ti и GeForce RTX 2060, которые в остальном довольно-таки близки по своему вычислительному потенциалу.

Производитель NVIDIA
Название GP106 GP104 TU116 TU106 TU104
Микроархитектура Pascal Pascal Turing Turing Turing
Техпроцесс, нм 16 nm FinFET 16 nm FinFET 12 нм FFN 12 нм FFN 12 нм FFN
Число транзисторов, млн 4400 7 200 6 600 10 800 13 600
Площадь чипа, мм2 200 314 284 445 545
Конфигурация SM/TPC/GPC
Число SM 10 20 24 36 48
Число TPC 5 20 12 18 24
Число GPC 2 4 3 3 6
Конфигурация потокового мультипроцессора (SM)
FP32-ядра 128 128 64 64 64
FP64-ядра 4 4 2 2 2
INT32-ядра Нет Нет 64 64 64
Тензорные ядра Нет Нет Нет 8 8
RT-ядра Нет Нет Нет 1 1
Объем кеша L1, Кбайт 48 48 32/64 из 96 (общий с разделяемой памятью) 32/64 из 96 (общий с разделяемой памятью) 32/64 из 96 (общий с разделяемой памятью)
Объем разделяемой памяти, Кбайт 96 96 32/64 из 96 (общий с кешем L1) 32/64 из 96 (общий с кешем L1) 32/64 из 96 (общий с кешем L1)
Объем регистрового файла, Кбайт 256 256 256 256 256
Программируемые вычислительные блоки GPU
FP32-ядра 1280 2 560 1 536 2 304 3 072
FP64-ядра 40 80 48 72 96
INT32-ядра Нет Нет 1 536 2 304 3 072
Тензорные ядра Нет Нет Нет 288 384
RT-ядра Нет Нет Нет 36 48
Блоки GPU фиксированной функциональности
TMU (блоки наложения текстур) 80 160 96 144 192
ROP 48 64 48 64 64
Конфигурация памяти
Объем кеша L2, Кбайт 1 536 2 048 1 536 4 096 4 096
Разрядность шины RAM, бит 192 256 192 256 256
Тип микросхем RAM GDDR5 GDDR5/GDDR5X GDDR6 GDDR6 GDDR6
Интерфейс SLI/NVLINK Нет 2 × SLI Gen. 2 Нет Нет 1 × NVLink 2.0×8

Что бы в действительности ни произошло с тензорными ядрами TU116, новый чип трудно сравнить по площади и количеству транзисторов с TU106: эти параметры NVIDIA уменьшила на 26 и 39% соответственно. В результате по транзисторному бюджету TU116 оказался в промежутке между двумя чипами предыдущего поколения — GP106 и GP104, а по числу главных исполнительных блоков (32-битных CUDA-ядер и текстурных модулей) ближе к первой, нежели второй модели. У TU116 и GP106 одинаковый объем кеш-памяти второго уровня (1,5 Мбайт), регистрового файла в пересчете на один SM (256 Кбайт) и разрядность шины RAM (192 бит).

Вместе с тем, чипы архитектуры Turing отличаются от Pascal массой оптимизаций конвейера, которые в совокупности позволяют лучше раскрыть теоретическую производительность GPU в реальных задачах. Это и кеш первого уровня, обладающий сниженной латентностью за счет слияния с разделяемой памятью, и отдельный кеш инструкций нулевого уровня, и возможность относительно независимой планировки потоков. Но для того, чтобы описать суть и функцию всех нововведений, нам пришлось бы повторить добрую часть вводной статьи, посвященной архитектуре Turing — лучше освежите память с ее помощью.

NVIDIA TU116

 

NVIDIA TU106

⇡#Технические характеристики, цена

В составе GeForce GTX 1660 Ti используется полностью функциональная версия TU116, которая несет 1536 шейдерных ALU (32-битных CUDA-ядер) и 96 блоков наложения текстур. По сравнению с GeForce RTX 2060 младшая модель сохранила 80% данных вычислительных ресурсов, но благодаря тому, что GTX 1660 Ti характеризуется наивысшими тактовыми частотами в таблице референсных спецификаций ускорителей на чипах Turing, по теоретическому быстродействию в операциях с плавающей запятой стандартной точности (FP32) и скорости наложения текстур он отвоевал уже 84% вычислительной мощности GeForce RTX 2060.

Если же сравнивать GTX 1660 Ti с видеокартами семейства GeForce 10, то новинка дает хорошее представление о тех преимуществах, которые подарили видеокартам NVIDIA техпроцесс 12 нм и архитектура Turing, не обремененная тензорными (если верить NVIDIA) и RT-ядрами. Так, GeForce GTX 1060 и GeForce GTX 1660 Ti работают в рамках одинакового резерва мощности (120 Вт) и близки по тактовым частотам (Boost Clock у этих моделей достигает 1708 и 1770 МГц соответственно). Но в новом чипе инженеры NVIDIA смогли поместить на 20% больше 32-битных CUDA-ядер и текстурных блоков, а пиковая производительность в операциях FP32, как следствие, увеличилась на 24%.

Производитель NVIDIA
Модель GeForce GTX 1060 6 Гбайт GeForce GTX 1070 GeForce RTX 1660 Ti GeForce RTX 2060 GeForce RTX 2070 GeForce RTX 2080 GeForce RTX 2080 Ti
Графический процессор
Название GP106 GP104 TU116 TU106 TU106 TU104 TU102
Микроархитектура Pascal Pascal Turing Turing Turing Turing Turing
Техпроцесс, нм 16 нм FinFET 16 нм FinFET 12 нм FFN 12 нм FFN 12 нм FFN 12 нм FFN 12 нм FFN
Число транзисторов, млн 4400 7 200 6 600 10 800 10 800 13 600 18 600
Тактовая частота, МГц: Base Clock / Boost Clock 1506/1708 1 506 / 1 683 1500/1770 1365/1680 1 410 / 1 620 (Founders Edition: 1 410 / 1 710) 1 515 / 1 710 (Founders Edition: 1 515 / 1 800) 1 350 / 1 545 (Founders Edition: 1 350 / 1 635)
Число шейдерных ALU 1280 1 920 1536 1920 2304 2944 4352
Число блоков наложения текстур 80 120 96 120 144 184 272
Число ROP 48 64 48 48 64 64 88
Оперативная память
Разрядность шины, бит 192 256 192 192 256 256 352
Тип микросхем GDDR5 SDRAM GDDR5 SDRAM GDDR6 SDRAM GDDR6 SDRAM GDDR6 SDRAM GDDR6 SDRAM GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 2000 (8000) 2250 (9000) 2 000 (8 000) 1 500 (12 000) 1 750 (14 000) 1 750 (14 000) 1 750 (14 000) 1 750 (14 000)
Объем, Мбайт 6 144 8 192 6 144 6 144 8 192 8 192 11 264
Шина ввода/вывода PCI Express 3.0×16 PCI Express 3.0×16 PCI Express 3.0×16 PCI Express 3.0×16 PCI Express 3.0×16 PCI Express 3.0×16 PCI Express 3.0×16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 4372 6 463 5437 6451 7 465 / 7 880 (Founders Edition) 10 069 / 10 598 (Founders Edition) 13 448 / 14 231 (Founders Edition)
Производительность FP32/FP64 1/32 1/32 1/32 1/32 1/32 1/32 1/32
Производительность FP32/FP16 1/128 1/128 2/1 2/1 2/1 2/1 2/1
Пропускная способность оперативной памяти, Гбайт/с 192/216 256 288 336 448 448 616
Вывод изображения
Интерфейсы вывода изображения DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.4a, HDMI 2.0b DL DVI-D, DisplayPort 1.4a, HDMI 2.0b DL DVI-D, DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b
TBP/TDP, Вт 120 150 120 160 175/185 (Founders Edition) 215/225 (Founders Edition) 250/260 (Founders Edition)
Розничная цена (США, без налога), $ 249 (рекомен-дованная) / 299 (Founders Edition, nvidia.com) 349 (рекомен-дованная) / 399 (Founders Edition, nvidia.com) 279 (рекомен-дованная) 349 (рекомен-дованная) / 349 (Founders Edition, nvidia.com) 499 (рекомен-дованная) / 599 (Founders Edition, nvidia.com) 699 (рекомен-дованная) / 799 (Founders Edition, nvidia.com) 999 (рекомен-дованная) / 1 199 (Founders Edition, nvidia.com)
Розничная цена (Россия), руб. НД (рекомен-дованная) / 22 990 (Founders Edition, nvidia.ru) НД (рекомен-дованная) / 31 590 (Founders Edition, nvidia.ru) 22 990 (рекомен-дованная) НД (рекомен-дованная) / 31 990 (Founders Edition, nvidia.ru) НД (рекомен-дованная) / 47 990 (Founders Edition, nvidia.ru) НД (рекомен-дованная) / 63 990 (Founders Edition, nvidia.ru) НД (рекомен-дованная) / 95 990 (Founders Edition, nvidia.ru)

Как мы уже поняли, GeForce GTX 1660 Ti по своим основным характеристикам является продолжателем традиций серии GeForce RTX, только без трассировки лучей и с поправкой на иной набор вычислительных блоков. Вот еще одна черта, которая роднит GeForce GTX 1660 Ti со старшими «Тьюрингами» — кадровый буфер на основе микросхем GDDR6. Однако пропускная способность шины памяти (ПСП), которую дают чипы номинала 14 Гбит/с на контакт, TU116 ни к чему, поэтому новинка довольствуется скоростью 12 Гбит/с. Как бы то ни было, итоговая ПСП у GTX 1660 Ti на 33% выше по сравнению с модификациями GeForce GTX 1060 второй волны, которые оснащаются чипами GDDR5 9 Гбит/с.

В итоге GeForce GTX 1660 Ti можно охарактеризовать как модернизированный аналог GeForce GTX 1060, который за счет усиленного набора вычислительных блоков сделал крупный шаг в сторону GeForce GTX 1070. Но не будем забывать и о том, что в практических задачах чипам архитектуры Turing проще достигнуть своей теоретической производительности, чем их прародителям из семейства Pascal, благодаря оптимизированной структуре потокового мультипроцессора, увеличенному кешу первого уровня и другим не столь существенным нововведениям — это уже доказали видеокарты под маркой GeForce RTX. Так что в предварительных оценках реального быстродействия все-таки нужно поместить GTX 1660 Ti ближе к GTX 1070, нежели GTX 1060.

GeForce GTX 1660 Ti поступит в продажу по рекомендованной стоимости $279. Как видим, NVIDIA и в этом случае продает новую видеокарту дороже, чем ее прямого предшественника (GeForce GTX 1060 стартовал на отметке $249), хотя ни о какой трассировке лучей уже речи не идет. Но прежде чем в очередной раз возмутиться алчности производителя, стоит окинуть взглядом положение дел, которое сложилось на рынке потребительских видеокарт ценой до $400.

Ближайшая модель серии GeForce RTX — 2060 — обладает рекомендованной стоимостью $349, и такую же цену получил в начале своего пути GeForce GTX 1070. А ведь GeForce GTX 1660 Ti наверняка не слишком отличается от последнего по быстродействию в играх. С другой стороны, формальный конкурент GTX 1660 Ti — Radeon RX 590 — сейчас стоит не меньше $259, хотя начинал с $279. Получается, и тут продукт NVIDIA стартовал с более низкой позиции.

Что касается российского рынка, то для GTX 1660 Ti объявлена рекомендованная цена в 22 990 рублей, но едва ли она удержится долго, ведь за такие деньги уже можно купить одну из простейших модификаций GeForce RTX 2060, а Radeon RX 590 у нас стоит от 18 660 р. Какими бы ни были розничные цены первых партий GeForce GTX 1660 Ti, геймерам, рассматривающим видеокарты этой категории, стоит повременить с покупкой — прайс-листы наверняка будет сильно штормить.

⇡#GIGABYTE GeForce GTX 1660 Ti OC: конструкция

Для знакомства с физическим воплощением GeForce GTX 1660 Ti нам прислали видеокарту GIGABYTE. Нет сомнений, что эта фирма выпустит несколько устройств на чипе TU116 для покупателей с разным уровнем потребностей и достатка. Но перед нам явно бюджетное устройство — это видно уже по маркировке, в которой нет сокращенных слов AORUS и WINDFORCE, сигнализирующих о принадлежности к более изысканным маркам в каталоге GIGABYTE. Но это как раз к лучшему, ведь на сей раз речь идет о массовой видеокарте, которую следует изучить, убрав из уравнения такие переменные, как избыточно мощная система охлаждения и отбор кристаллов GPU с наилучшим частотным потенциалом.

Впрочем, наш экземпляр GIGABYTE GeForce GTX 1660 Ti имеет маркировку OC, которая указывает на заводской оверклокинг. Не известно, сколь сильно производитель увеличил частоты GPU — точных спецификаций этой видеокарты нам не сообщили, а базовую частоту устройств на чипах Turing партнеры NVIDIA практически никогда не меняют. Но едва ли GIGABYTE GeForce GTX 1660 Ti разогнана настолько, чтобы дать TU116 неоправданное преимущество в тестах, где мы столкнем ее с референсными устройствами NVIDIA и AMD.

Внешний вид и особенности конструкции GIGABYTE GeForce GTX 1660 Ti не нуждаются в подробном описании. Корпус ускорителя целиком сделан из пластика — даже защитная панель на обратной стороне печатной платы выполнена из него же. Но если честно, металлический щиток, который монтируют на PCB более дорогих моделей, порой тоже выполняет чисто декоративную функцию и не участвует в охлаждении компонентов. Иных украшений видеокарта лишена. В частности, на ней нет ни единого светодиода, не говоря уже об RGB-подсветке или возможности питания светодиодных лент.

За охлаждение устройства отвечают два вентилятора диаметром 87 мм — здесь тоже нет никаких изысков, но применяется решение, которое GIGABYTE и некоторые другие производители ввели для снижения турбулентности воздушного потока: крыльчатки вращаются в противоположные стороны.

Радиатор кулера представляет собой простую конструкцию из блока алюминиевых ребер и плоского основания, которое накрывает графический процессор и два из шести чипов памяти GDDR6. Единственная теплотрубка диаметром 5 мм согнута в S-образную форму и пропущена через основание радиатора таким образом, что ее середина примыкает к кристаллу GPU. К чести производителя стоит выделить тот факт, что компоненты регулятора напряжения тоже отдают тепло основному радиатору СО вместо отдельного «огрызка», как это часто делали в недорогих устройствах прошлых лет, причем активное охлаждение получили не только полевые транзисторы с интегрированным драйвером, но и дроссели VRM.

⇡#GIGABYTE GeForce GTX 1660 Ti OC: печатная плата

Пластиковый кожух, который обернут вокруг свободного конца печатной платы GIGABYTE GeForce GTX 1660 Ti, маскирует ее небольшие габариты. На основе этой PCB вполне можно сделать видеокарту форм-фактора Mini-ITX, и если судить по пустующим площадкам для двух чипов GDDR6, она уже используется в составе какого-то другого устройства на чипе семейства Turing, причем с 256-битной шиной памяти. Среди всех продуктов серии GeForce RTX есть лишь один подходящий кандидат — RTX 2070, а чипы TU116 и TU106, выходит, являются электрически взаимозаменяемыми. Преобразователь напряжения GIGABYTE GeForce GTX 1660 Ti изначально рассчитан на восемь фаз, но в связи с умеренным энергопотреблением TU116 на текстолите распаяны компоненты лишь шесть из них: четыре для графического процесссора и две для микросхем RAM. Впрочем, как и в ускорителях серии GeForce RTX, в составе VRM здесь применяются полевые транзисторы с интегрированным драйвером (т.н. DrMOS или «силовые каскады» — power stages), благодаря которым ШИМ-контроллер точнее регулирует напряжение на стоке транзистора и возрастает КПД преобразования.

Микросхемы GDDR6 производства Micron с маркировкой 8XA77 D9WCR работают со штатной пропускной способностью 12 Гбит/с на контакт шины. Кристалл TU116 на этой плате не имеет буквы А в среднем блоке маркировки, которая у старших моделей на чипах Turing выделяет GPU отборного качества, обладающие повышенным частотным потенциалом. Стало быть, NVIDIA отказалась от предварительной категоризации образцов TU116, а может, нам наконец-то попался Turing «второго сорта». Независимо от того, какая версия соответствует действительности, разогнать эту видеокарту будет особенно интересно, ведь она покажет, на что можно рассчитывать в попытках оверклокинга простых модификаций GeForce GTX 1660 Ti, доступных за умеренные деньги.

Следующая страница →

⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

Полный текст статьи читайте на 3DNews