Видеоускоритель Nvidia GeForce GTX 1660 Ti: новая «промежуточная» линейка на Turing, но без технологий GeForce RTX (базовый обзор с теоретической частью, синтетическими и игровыми тестами)13.03.2019 03:45

Справочные материалы:

Теоретическая часть: особенности архитектуры

Выход видеокарт Nvidia, основанных на графической архитектуре Turing, стал важной вехой для 3D-графики реального времени. Первые решения линейки GeForce RTX были представлены компанией еще осенью, и постепенно Nvidia выпустила несколько моделей, предназначенных для разных ценовых диапазонов: GeForce RTX 2080 Ti, GeForce RTX 2080, GeForce RTX 2070 и GeForce RTX 2060.

Самое важное нововведение в GPU этого семейства — специализированные блоки для аппаратного ускорения трассировки лучей, позволяющие использовать физически корректный расчет распространения лучей света, в отличие от растеризации, лишь имитирующей их поведение. В GeForce RTX мы увидели первую массовую реализацию технологии, которая уже используется в двух играх: Battlefield V — для рендеринга реалистичных отражений, и Metro Exodus, где трассировка лучей применяется для расчета глобального освещения и затенения. Второй важной функциональностью Turing стало добавление еще одного типа вычислительных блоков — тензорных ядер, которые быстро справляются с алгоритмами глубокого обучения, что также уже применяется в играх в виде DLSS.

Специалисты Nvidia решили внедрить специализированные блоки для этих задач в Turing, что может серьезно сказаться на всем дальнейшем развитии графики в целом, но включение этих весьма сложных блоков дополнительно к уже имеющимся, при отсутствии серьезного прогресса в микроэлектронном производстве (используемый новинками техпроцесс 12 нм по своим характеристикам лишь чуть лучше 16-нанометрового), привело к увеличению размера кристаллов новых GPU, которые получились весьма крупными и дорогостоящими в производстве, что сказалось и на розничных ценах.

В феврале пришло время и для менее дорогих GPU новой архитектуры. Графический процессор TU116 стал первым среди бюджетного подсемейства Turing, который предназначен для решений с ценами ниже $300, и первой видеокартой на основе этого чипа стала модель GeForce GTX 1660 Ti, предлагаемая по цене $279. При подготовке среднебюджетных решений семейства Turing возможность оставить в них RT-ядра и тензорные ядра была лишь теоретической — уж слишком сильно они усложняют чипы. Задолго до выхода GPU этого уровня распространялись слухи о том, что они лишатся специализированных блоков для аппаратного ускорения трассировки лучей и глубокого обучения, так и получилось в итоге: модель GeForce GTX 1660 Ti вышла с приставкой GTX, а не RTX, и этот GPU не включает в себя RT-ядра и тензорные ядра, с которыми мы познакомились в предыдущих решениях семейства.

Оно и неудивительно, ведь в сильно ограниченном транзисторном бюджете этой ценовой категории было бы невозможно предложить достаточный уровень производительности таких блоков, так как даже GeForce RTX 2060 с трудом справляется с этими задачами, и не в самых высоких разрешениях. А добавление тех же RT-ядер к GPU не имеет смысла без соответствующего уровня производительности обычных CUDA-ядер. С тензорными ядрами вопрос сложнее, и мы его подробно рассмотрим далее. В любом случае, факт в том, что GeForce GTX 1660 Ti не имеет поддержки аппаратного ускорения трассировки лучей и глубокого обучения и фокусируется на достижении максимально возможной производительности в существующих играх в рамках транзисторного бюджета.

В архитектуре Turing инженеры компании Nvidia внедрили и множество других улучшений по сравнению с архитектурой Pascal: одновременное исполнение операций с плавающей запятой FP32 и целочисленных INT32, значительно измененную и улучшенную систему кэширования данных и несколько новых технологий рендеринга: программируемый конвейер обработки геометрии, переменную частоту затенения, затенение в текстурном пространстве, поддержку последних версий технологий DirectX 12, относящихся к уровню возможностей Feature Level 12_1.

Благодаря всем улучшениям мультипроцессоров Turing, по производительности и энергоэффективности видеокарта на базе TU116 превосходит аналогичные GPU из предыдущих семейств. Новый GPU особенно хорош в современных играх, использующих сложные шейдеры. Модель GeForce GTX 1660 Ti в среднем в 2–3 раза быстрее GeForce GTX 960 и до полутора раз быстрее GeForce GTX 1060 6GB в самых требовательных играх последнего времени.

Да и в сверхпопулярных многопользовательских проектах, таких как PUBG, Apex Legends, Fortnite и Call of Duty Black Ops 4, новый GPU позволяет получить 120 FPS и более при высоких настройках качества в Full HD-разрешении. Это довольно важно для динамичных сетевых шутеров, тогда как на видеокартах уровня GeForce GTX 960 игроки получают в тех же условиях лишь 50–60 FPS. А для таких игр высокая частота кадров довольно важна, ведь привычная мерка в 60 FPS в них не является пределом мечтаний — при подключении мониторов с частотой обновления 120–144 Гц удвоенный прирост плавности может принести и повышенную эффективность в сражениях.

В общем, GeForce GTX 1660 Ti за его цену даже чисто на бумаге выглядит весьма интересным решением для обновления видеоподсистемы у тех игроков, кто еще не сделал апгрейда на Pascal. На сегодняшний день почти две трети (64%) игроков имеют видеокарты уровня GeForce GTX 960 или ниже, а новинка предлагает уровень производительности вдвое-втрое выше этого устаревшего GPU практически во всех играх и поэтому довольно привлекательна для апгрейда.

Так как рассматриваемая модель видеокарты компании Nvidia основана на графическом процессоре архитектуры Turing, также имеющей много общего и с предыдущими архитектурами Pascal и Volta, то перед прочтением материала мы советуем ознакомиться с нашими предыдущими статьями:

Графический ускоритель GeForce GTX 1660 Ti
Кодовое имя чипа	TU116
Технология производства	12 нм FinFET
Количество транзисторов	6,6 млрд (у GP106 — 4,4 млрд)
Площадь ядра	284 мм² (у GP106 — 200 мм²)
Архитектура	унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	DirectX 12, с поддержкой уровня возможностей Feature Level 12_1
Шина памяти	192-битная: 6 независимых 32-битных контроллеров памяти с поддержкой памяти типов GDDR5 и GDDR6
Частота графического процессора	1500 (1770) МГц
Вычислительные блоки	24 потоковых мультипроцессора, включающих 1536 CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32
Блоки текстурирования	96 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP)	6 широких блоков ROP (48 пикселей) с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов	поддержка подключения по интерфейсам HDMI 2.0b и DisplayPort 1.4a

Спецификации референсной видеокарты GeForce GTX 1660 Ti
Частота ядра	1500 (1770) МГц
Количество универсальных процессоров	1536
Количество текстурных блоков	96
Количество блоков блендинга	48
Эффективная частота памяти	12 ГГц
Тип памяти	GDDR6
Шина памяти	192-бит
Объем памяти	6 ГБ
Пропускная способность памяти	288 ГБ/с
Вычислительная производительность (FP16/FP32)	11,0/5,5 терафлопс
Теоретическая максимальная скорость закраски	85 гигапикселей/с
Теоретическая скорость выборки текстур	170 гигатекселей/с
Шина	PCI Express 3.0
Разъемы	в зависимости от видеокарты
Энергопотребление	до 120 Вт
Дополнительное питание	один 8-контактный разъем
Число слотов, занимаемых в системном корпусе	2
Рекомендуемая цена	$279 (22 990 рублей)

Рассматриваемая сегодня модель открывает новое семейство видеокарт — серию GeForce GTX 16, которая отличается от серии GeForce RTX 20 и суффиксом, и численными значениями серии. Если с заменой RTX на GTX все понятно (карты GTX не имеют поддержки технологий, которые есть у RTX), то меньшее значение для серии выглядит немного странно — видимо, в Nvidia решили не давать этим картам серию 20, чтобы сильнее разделить серии из маркетинговых соображений. А вот почему было выбрано именно число 16 — не очень понятно (кроме очевидного факта, что оно между 10 и 20). Почему не 15, например?

Интересно, что видеокарта GTX 1660 Ti не имеет публичного референсного варианта, равно как и Founders Edition. Партнеры компании делают собственные дизайны карт на основе внутреннего эталонного дизайна карты Nvidia, и в этом случае мы сразу же увидели в продаже множество вариантов карт с различными характеристиками и системами охлаждения. Кстати, с большой долей вероятности можно предположить, что на основе урезанной версии чипа TU116 у Nvidia в скором времени выйдут и другие решения семейства GTX 16, как бывало ранее.

GeForce GTX 1660 Ti поступила в продажу по цене от $279, то есть на $30 дороже GTX 1060 6GB, которую она и заменяет в линейке компании. Конечно же, это дешевле, чем $349 за RTX 2060, но такое решение снова выглядит как повышение цен на GPU определенного ценового диапазона. Если в случае с RTX оно было оправдано новыми технологиями, то в случае с GTX 1660 Ti это просто повышение цены для среднебюджетного GPU. Что еще более странно с учетом того, что новинка является прямой заменой для GTX 1060 6GB. Те, правда, уже почти все распроданы и не будут мешать продажам новой видеокарты.

Вероятно, выставленная цена имеет некоторое отношение к цене прямого конкурента новинки — не так давно вышедшей видеокарты AMD семейства Polaris, Radeon RX 590, поступившей в продажу изначально за те же деньги. Конкурент из этой Radeon для новой GeForce получается так себе, и ему помогает разве что снижение цены, ведь по производительности GTX 1660 Ti должна быть ближе к более дорогой Radeon RX Vega 56. Кстати, некоторое время партнеры AMD даже продавали эту видеокарту за примерно такие же деньги, но это была разовая акция и далеко не во всех странах, так что мы продолжаем считать прямым конкурентом новинки именно RX 590.

В новом GPU инженеры решили использовать проверенную временем 192-битную шину памяти, которая ограничивает возможные варианты объема видеопамяти значениями 6 ГБ или 12 ГБ. Второй вариант крутоват для модели этого ценового сегмента, особенно учитывая дорогую GDDR6-память, поэтому пришлось ограничиться 6 ГБ. Как и в случае RTX 2060, это кажется компромиссным решением, хотелось бы иметь 8 ГБ. Впрочем, в реальном применении в течение актуального жизненного цикла GPU, с учетом того, что он рассчитан на разрешение Full HD, случаи с жесткой нехваткой видеопамяти вряд ли будут возникать слишком часто.

Еще одной важной характеристикой любого GPU является потребление энергии, и тут Nvidia смогла вместить GTX 1660 Ti в тот же теплопакет 120 Вт, что и GTX 1060 6GB. Видимо, за это во многом стоит поблагодарить отказ от технологий RTX, так как старшие чипы Turing потребляют больше энергии, чем их предшественники из семейства Pascal.

GeForce GTX 1660 Ti вышла в продажу еще 22 февраля и партнеры компании Nvidia сразу предложили широкий набор различных модификаций этой видеокарты на основе их собственного дизайна, включая фабрично разогнанные варианты с самыми разными системами охлаждения, имеющими от одного до трех вентиляторов:

Типичная видеокарта модели GeForce GTX 1660 Ti довольствуется одним 8-контактным разъемом дополнительного питания PCI Express, а вот количество и тип разъемов вывода информации на дисплеи зависит исключительно от конкретной карты. Сам по себе GPU поддерживает все те же разъемы и стандарты DVI, HDMI, DisplayPort и VirtualLink, что и более мощные решения семейства Turing.

Архитектурные особенности

Главное, что отличает TU116 от чипов TU10x с архитектурной точки зрения — отсутствие самой интересной части функциональности, появившейся именно в чипах семейства Turing. Из нового среднебюджетного GPU были убраны аппаратные блоки для ускорения трассировки лучей и тензорные ядра — все для того, чтобы недорогой графический процессор был не слишком сложным и лучше делал свое основное дело — традиционный рендеринг привычным методом растеризации.

С площадью кристалла в 284 мм² чип TU116 получился значительно меньше самого слабого из представленных ранее чипов семейства Turing — TU106. Естественно, и количество транзисторов уменьшилось с 10,8 млрд до 6,6 млрд, что очень серьезно снижает себестоимость производства, очень важную для среднебюджетных графических процессоров. Но если сравнивать TU116 с GP106, то новый GPU примерно настолько же больше него по размеру (200 мм² у GP106), так что изменения в мультипроцессорах Turing тоже не обошлись даром.

По доступным публике данным не слишком просто понять, насколько велик вклад именно RT-ядер и тензорных ядер в сложность старших чипов Turing, так как TU116 имеет меньшее количество мультипроцессоров и других блоков по сравнению с TU106 и напрямую их сравнить не получится. Но давайте все же рассмотрим характеристики нескольких моделей видеокарт Nvidia из двух последних поколений, близких друг к другу по цене:

	GTX 1660 Ti	RTX 2060	GTX 1060
Кодовое имя GPU	TU116	TU106	GP106
Кол-во транзисторов, млрд	6,6	10,8	4,4
Площадь кристалла, мм²	284	445	200
Базовая частота, МГц	1500	1365	1506
Турбо-частота, МГц	1770	1680	1708
CUDA-ядра, шт	1536	1920	1280
Производительность FP32, TFLOPS	5,5	6,5	4,4
Тензорные ядра, шт.	0	240	0
RT-ядра, шт.	0	30	0
Блоки ROP, шт.	48	48	48
Блоки TMU, шт.	96	120	80
Объем видеопамяти, ГБ	6	6	6
Шина памяти, бит	192	192	192
Тип памяти	GDDR6	GDDR6	GDDR5
Частота памяти, ГГц	12	14	8
ПСП памяти, ГБ/с	288	336	192
Энергопотребление TDP, Вт	120	160	120
Рекомендованная цена, $	279	349	249(299)

TU116 имеет ту же архитектуру мультипроцессоров, что и видеокарты семейства GeForce RTX, за исключением RT-ядер и тензорных ядер (некоторые подробности будут ниже), так что сравнивать с RTX 2060 новинку можно. В модели GTX 1660 Ti применяется полный чип TU116, и количество мультипроцессоров в нем было сокращено до 24 по сравнению с TU106. Кроме этого, немного снизили частоту GDDR6-памяти с 14 ГГц до 12 ГГц, оставив 192-битную шину. В остальном же эти чипы вполне сравнимы — и в теории, и на практике. Как бы компенсируя меньшее количество исполнительных блоков, GTX 1660 Ti получила чуть большую тактовую частоту, хотя эта разница особой роли не играет.

Если сравнивать по пиковым показателям, то GTX 1660 Ti получился даже чуть быстрее RTX 2060 по филлрейту — из-за одинакового количества блоков ROP и чуть повышенной частоты, а вот по более важным показателям математической и текстурной производительности новинка обеспечивает где-то около 85% производительности старшей RTX 2060. Впрочем, по сравнению с GTX 1060 6GB новая видеокарта минимум на четверть быстрее ее по этим же показателям, по ПСП вообще наполовину, а вот преимущество по филлрейту почти отсутствует. То есть, GTX 1660 Ti должна быть по скорости где-то между этими двумя моделями и близко к уровню еще одной — GTX 1070.

Полная версия чипа TU116 в модификации для GTX 1660 Ti содержит три кластера Graphics Processing Cluster (GPC), и в каждом из них — по четыре кластера Texture Processing Cluster (TPC), состоящих из движков PolyMorph Engine и пары мультипроцессоров SM. В свою очередь, каждый SM состоит из: 64 CUDA-ядер и четырех блоков текстурирования TMU. То есть, всего TU116 содержит 1536 CUDA-ядер в 24 мультипроцессорах. Подсистема памяти состоит из шести 32-битных контроллеров памяти, что дает нам в целом 192-битную шину.

Что касается тактовых частот графического процессора, то базовая частота чипа GeForce GTX 1660 Ti равна 1500 МГц, а турбо-частота достигает 1770 МГц. Как обычно для решений Nvidia, это не максимальная частота, а средняя для нескольких игр и приложений. Реальная частота в каждом случае будет отличаться, так как она зависит как от игры, так и от условий конкретной системы (питания, температура и т. п.). Видеопамять стандарта GDDR6 работает на частоте 12 ГГц, что дает нам очень высокую для среднебюджетного сегмента пропускную способность в 288 ГБ/с.

Кроме отрезания функциональности RTX, TU116 ничем не хуже своих старших братьев — в остальном по своим возможностям он полностью соответствует чипам TU10x, архитектура мультипроцессоров в целом одинакова. И с программной точки зрения, GTX 1660 Ti ничем не отличается от решений GeForce RTX, кроме поддержки аппаратной трассировки лучей и ускорения задач глубокого обучения при помощи тензорных ядер — эти задачи тоже будут выполняться, просто со значительно меньшей скоростью.

Мультипроцессор в TU116 почти идентичен блокам SM, которые мы видели в старших чипах Turing. Он состоит из четырех разделов и имеет свои текстурные блоки и кэш-память первого уровня. Даже размеры кэшей и регистрового файла в мультипроцессорах не изменились. А вот что изменилось в TU116 по сравнению со старшими чипами семейства, так это объем кэш-памяти второго уровня вне мультипроцессоров. Если старшие чипы Turing имеют по 512 КБ L2-кэша на раздел ROP (и у TU106 всего получается 4 МБ), то TU116 ограничен лишь 256 КБ L2-кэша (1,5 МБ на чип).

Структура нового дизайна мультипроцессоров SM отличается от того, что было в Pascal. Мультипроцессор Turing разделен на четыре раздела — каждый с собственным блоком планирования и распределения (warp scheduler and dispatch unit), и способен выполнять по 32 потока за такт. В разделах есть несколько типов исполнительных блоков: 16 ядер FP32, 16 ядер INT32 и 32 ядра для исполнения операций с FP16 точностью. Самое важное отличие заключается в том, что обработкой целочисленных операций и операций с плавающей запятой теперь занимаются разные блоки, а операции со сниженной точностью FP16 выполняются вдвое быстрее, чем FP32.

И это повышает эффективность загрузки блоков GPU. Приведем пример шейдеров из игры Shadow of the Tomb Raider, в которых на каждые 100 инструкций приходится в среднем 38 инструкций INT32 и 62 FP32. Все предыдущие архитектуры Nvidia, включая Pascal, выполняют их последовательно одна за другой, а Turing умеет параллельно выполнять INT и FP, так как в SM появились дополнительные блоки для исполнения целочисленных операций.

Одновременное исполнение FP- и INT-операций обеспечивает более эффективное исполнение шейдеров, и в сложных случаях прирост получается в полтора раза и более. В частности, общая производительность рендеринга GeForce GTX 1660 Ti в игре Shadow of the Tomb Raider примерно в полтора раза выше, чем у GTX 1060 6GB, хотя это связано не только с указанной модификацией, конечно же.

Также в Turing была значительно улучшена система кэширования — внедрена унифицированная архитектура для разделяемой памяти и кэшей: первого уровня и текстурного. Новая система кэширования имеет вдвое больше блоков загрузки-выгрузки данных (Load-Store Unit — LSU), шире линии передачи данных в кэш-память и обратно (32-бита против 16-бит) и большее их количество, а также втрое больший объем L1-кэша по сравнению с аналогичным GPU из семейства Pascal (GeForce GTX 1060).

Новый дизайн системы кэширования значительно увеличил эффективность кэширования данных и позволяет переконфигурировать размер кэша тогда, когда программистом не используется полный объем разделяемой памяти. L1-кэш может быть объемом 64 КБ, в дополнение к 32 КБ разделяемой памяти на каждый мультипроцессор, или наоборот, можно снизить объем L1-кэша до 32 КБ, оставив 64 КБ на разделяемую память.

Одной из игр, получающих преимущество от улучшений кэширования в Turing, стала Call of Duty Black Ops 4. По результатам внутренних тестов Nvidia, GeForce GTX 1660 Ti примерно на 50% быстрее своей предшественницы GTX 1060 6GB в этой игре — во многом из-за более эффективной работы кэш-памяти. Также наверняка сработала и быстрая GDDR6-память, поддержка которой появилась именно в Turing. GeForce GTX 1660 Ti имеет те же 6 ГБ памяти, подключенной к GPU по 192-битному интерфейсу, как и старшая модель GTX 1060, но из-за установки на нее скоростной GDDR6-памяти, работающей на эффективной частоте в 12 ГГц, новая модель имеет на 50% большую пропускную способность памяти.

Также архитектурой Turing поддерживаются новые технологии для увеличения производительности в играх: Variable Rate Shading (VRS) — переменная частота затенения, Texture-Space Shading — затенение в текстурном пространстве, Multi-View Rendering — отрисовка с нескольких позиций, Mesh Shading — полностью программируемый конвейер обработки геометрии, CR и ROVs — технологии DirectX 12 уровня возможностей Feature Level 12_1.

Переменная частота затенения позволяет реализовать два важных алгоритма адаптивной частоты затенения в зависимости от содержания и движения в сцене — Content Adaptive Shading и Motion Adaptive Shading. Оба алгоритма позволяют изменять частоту затенения для некоторых участков изображения, которые не требуют рендеринга с полным качеством, когда вполне достаточно и меньшего количества выборок для увеличения производительности.

К примеру, Motion Adaptive Shading позволяет регулировать частоту затенения в зависимости от наличия/скорости изменений в сцене. Самый простой и понятный пример — гоночная игра, где центральная часть с автомобилем игрока отрисовывается в полном качестве, а дорога и окружение на периферии кадра рендерятся с худшим качеством, так как они все равно слишком быстро движутся и человеческие глаза и мозг просто не могут увидеть разницу в качестве.

Или взять Content Adaptive Shading, при работе которого частота затенения определяется разницей в цвете соседних пикселей на протяжении нескольких кадров. Если цвета от кадра в кадр меняются слабо, как на поверхности неба, то вполне можно этот участок отрисовать с меньшей частотой затенения, и человек снова не увидит визуальной разницы. Переменная частота затенения уже используется в игре Wolfenstein II: The New Colossus, и меньшая работа по закраске пикселей приносит приличный прирост производительности, помогая GeForce GTX 1660 Ti быть в полтора раза быстрее, чем GTX 1060 6GB.

Часть улучшений в Turing пришла из Volta, а часть — новые архитектурные новинки, которые есть только в новейшем поколении. Некоторым могло показаться, что TU116 правильнее причислять к архитектуре Volta, так как у него нет RT-ядер и тензорных ядер, а многие улучшения в мультипроцессорах уже были сделаны в GV100. Это не соответствует действительности, так как в Turing есть изменения, которые отсутствуют в Volta: поддержка некоторых возможностей DirectX 12 (resource heap tier 2) и технологии, о которых мы выше рассказывали: Mesh Shading, Variable Rate Shading, Texture Space Shading и другие.

Также в архитектуре Turing были улучшены последние слабые места архитектуры Pascal относительно конкурирующей GCN у AMD, которые могли приводить к снижению производительности в ПК-играх на Pascal, так как код был оптимизирован для GCN. У Turing никаких слабостей уже не осталось, она всегда достаточно эффективна, в том числе с применением асинхронного исполнения шейдерных программ, популярного в современных играх.

Отметим еще один важный момент по поводу тензорных ядер. В TU116 их нет, как говорит Nvidia, но удвоенный темп выполнения операций с точностью FP16 остался, но в семействе GeForce RTX они выполняются на том же «железе», что и тензорные операции (при работе используется часть тензорных ядер). Для поддержки этой функциональности в TU116 пришлось оставить урезанную часть тензорных ядер — выделенные FP16-блоки, которые также могут работать одновременно с FP32-блоками (вместо INT, но не все три типа блоков вместе). И с программной точки зрения для приложений не будет никакой разницы, все GPU нового семейства способны выполнять FP16 с удвоенной производительностью.

Впрочем, конкретно в играх эта возможность до сих пор остается не особенно востребованной, так как из популярных проектов используется разве что в Wolfenstein II и Far Cry 5 (для симуляции водной поверхности), да и то — еще неизвестно, остались ли они в последних патчах. То же самое касается и того, что на всех решениях Turing могут выполняться параллельно FP32 FMA и INT32 операции, или FP16 (с удвоенной производительностью) и INT32 операции, или FP32 и ускоренные FP16. Теоретически, на этих FP16 блоках могут параллельно выполняться и тензорные операции, но лишь в теории, поддержки того же DLSS в TU116 нет и вряд ли она будет — тут даже удвоенной скорости FP16 не хватит.

Если говорить о вещах, не связанных с 3D, то в TU116 есть обновленный блок вывода информации, поддерживающий дисплеи с высоким разрешением, HDR и высокой частотой обновления. Все платы на графических процессорах архитектуры Turing имеют порты DisplayPort 1.4a, позволяющие вывести информацию на 8K-монитор с частотой обновления 60 Гц с поддержкой технологии VESA Display Stream Compression (DSC) 1.2, обеспечивающей высокую степень сжатия.

Все решения семейства Turing также поддерживают два 8K-дисплея при 60 Гц (требуется по одному кабелю на каждый), такое же разрешение также можно получить при подключении через установленный USB-C. Кроме этого, все TU1xx поддерживают полноценный HDR в конвейере вывода информации, включая tone mapping для различных мониторов — со стандартным динамическим диапазоном и расширенным.

Все новые GPU семейства Turing содержат улучшенный кодировщик видеоданных NVEnc, добавляющий поддержку сжатия данных в формате H.265 (HEVC) при разрешении 8K и 30 FPS. Из других улучшений — снижение битрейта при схожем качестве на 25% для HEVC и до 15% для H.264. Также был обновлен и декодер видеоданных NVDec, получивший поддержку декодирования данных в формате HEVC YUV444 10-бит/12-бит HDR при 30 FPS, в формате H.264 при 8K-разрешении и в формате VP9 с 10-бит/12-бит данными.

Чипы семейства Turing улучшили качество кодирования видеоданных, которое приблизилось к качеству чисто программных кодеров, а порой и опережает их. Так, NVEnc в Turing обеспечивает уровень качества программного кодирования программным кодером x264 с профилем Fast при гораздо меньшей нагрузке на CPU. Настолько меньшей, что GPU вполне «тянет» стриминг в разрешении 4К, слишком тяжелый для типичных процессоров при программном кодировании видео. Кодер Nvidia уже поддерживается в популярном пакете OBS для стриминга, и стримеры с его помощью могут транслировать игру при использовании одного ПК, что невозможно при программном кодировании.

Более подробно с возможностями семейства Turing вы можете ознакомиться в большом обзоре GeForce RTX 2080 Ti.

Предварительная оценка производительности и промежуточные выводы

Что касается производительности Turing по сравнению с Pascal, то все улучшения эффективности мультипроцессоров в новой архитектуре значительно улучшили как производительность (в полтора раза по оценке Nvidia), так и энергоэффективность (на 40%). Прирост производительности Turing по количеству исполняемых операций за такт в реальных играх составляет около полутора раз, а при том же уровне энергопотребления среднее преимущество GTX 1660 Ti над GTX 1060 6GB по итоговой частоте кадров можно оценить примерно в 35%-40%.

И чем новее игры используются, тем больше преимущество от увеличенной эффективности Turing. Так, если в устаревших проектах вроде Fallout 4 и Deus Ex: Mankind Divided преимущество новинки над GTX 1060 оказывается лишь 20%-30%, то в Shadow of the Tomb Raider и Call of Duty Black Ops 4 оно доходит до 40%-45% и даже более. В целом же можно сказать, что видеокарта модели GeForce GTX 1660 Ti явно разработана для игры в Full HD-разрешении, и она обеспечивает в этих условиях отличную производительность при максимальном качестве картинки.

Похоже, что с выходом решений линейки GeForce GTX 16 (за GTX 1660 Ti вскоре последуют и другие модели), компании Nvidia будет несколько проще продвигать возможности старшего подсемейства GeForce RTX, ведь они будут жестко разделены по возможностям и в более дешевых вариантах поддержки самых современных технологий в ближайшем будущем не ожидается.

Для тех, кому не нужны эти новые технологии (весьма впечатляющие, но пока что больше в теории, чем на практике — вышло всего две игры с поддержкой трассировки лучей и хотя трассировка приносит более качественный рендеринг, но многим игрокам не хватает вау-фактора) будут предложены решения GeForce GTX 16, а если игрок готов потратить больше денег за уникальные графические возможности — старшие видеокарты семейства Turing к их услугам.

Особенности видеокарты

Объект исследования: ускоритель трехмерной графики (видеокарта) MSI GeForce GTX 1660 Ti Gaming X 6 ГБ 192-битной GDDR6

Сведения о производителе: Компания Nvidia Corporation (торговая марка Nvidia) основана в 1993 году в США.Штаб-квартира в Санта-Кларе (Калифорния). Разрабатывает графические процессоры, технологии. До 1999 года основной маркой была Riva (Riva 128/TNT/TNT2), с 1999 года и по настоящее время — GeForce. В 2000 году были приобретены активы 3dfx Interactive, после чего торговые марки 3dfx/Voodoo перешли к Nvidia. Своего производства нет. Общая численность сотрудников (включая региональные офисы) — около 5000 человек.

Характеристики карты

MSI GeForce GTX 1660 Ti Gaming X 6 ГБ 192-битной GDDR6
GPU	GeForce GTX 1660 Ti (TU116)
Интерфейс	PCI Express x16
Частота работы GPU (ROPs), МГц	Референс: 1500—1770(Boost)—1965(Max) MSI: 1500—1875(Boost)—2010(Max)
Частота работы памяти (физическая (эффективная)), МГц	Референс: 3000 (12 000) MSI: 3060 (12 240)
Ширина шины обмена с памятью, бит	192
Число вычислительных блоков в GPU	24
Число операций (ALU) в блоке	64
Суммарное количество блоков ALU (CUDA)	1536
Число блоков текстурирования (BLF/TLF/ANIS)	96
Число блоков растеризации (ROP)	48
Число блоков RayTracing	нет
Число тензорных блоков	нет
Размеры, мм	250×115×42
Количество слотов в системном блоке, занимаемые видеокартой	3
Цвет текстолита	черный
Энергопотребление пиковое в 3D, Вт	123
Энергопотребление в режиме 2D, Вт	20
Энергопотребление в режиме «сна», Вт	10
Уровень шума в 3D (максимальная нагрузка), дБА	25,9
Уровень шума в 2D (просмотр видео), дБА	18,0
Уровень шума в 2D (в простое), дБА	18,0
Видеовыходы	1×HDMI 2.0b 3×DisplayPort 1.4
Поддержка многопроцессорной работы	нет
Максимальное количество приемников/мониторов для одновременного вывода изображения	4
Питание: 8-контактные разъемы	1
Питание: 6-контактные разъемы	0
Максимальное разрешение/частота, Display Port	3840×2160@160 Гц (7680×4320@30 Гц)
Максимальное разрешение/частота, HDMI	3840×2160@60 Гц
Максимальное разрешение/частота, Dual-Link DVI	2560×1600@60 Гц (1920×1200@120 Гц)
Максимальное разрешение/частота, Single-Link DVI	1920×1200@60 Гц (1280×1024@85 Гц)
Средняя цена	24 700 руб. (на момент написания материала)

Особенности карты и сравнение с GTX 1060

MSI GeForce GTX 1660 Ti Gaming X	Nvidia GeForce GTX 1060
вид спереди

вид сзади

Мы сравниваем с GTX 1060 прежде всего потому, что GTX 1660 Ti будет замещать именно этот ускоритель, хотя по уровню производительности он примерно соответствует GTX 1070. Да и по ширине шины они с GTX 1060 схожи.

Для всех карт с шиной памяти 192 бит характерна разводка 256-битной шины на печатной плате, при этом просто не задействованы два посадочных места под микросхемы памяти (каждая микросхема имеет ширину подключения 32 бита, поэтому 256 − 2 × 32 = 192).

В схеме питания задействованы два ШИМ-контроллера: OnSemi NCP81610 управляет 4 фазами питания GPU, а uP1666Q производства uPI управляет двумя фазами питания микросхем памяти. Подвод питания осуществляется через один 8-контактный разъем.

Как обычно, с помощью утилиты MSI Afterburner можно не только напрямую повысить частоты работы карты, но и запустить Nvidia Scanner, который поможет определить безопасный максимум разгона ядра и памяти. И если Afterburner уже стала международно признанной и очень популярной программой, не привязанной к производителю видеокарт, то теперь MSI предлагает и утилиту Dragon Center, поддерживающую управление не только частотами, но и подсветкой.

Режимов работы красочной подсветки очень много.

В результате имеем очень красивую видеокарту в работе. В начале раздела описания карты имеется видеоролик, где это можно увидеть в динамике.

Карта имеет стандартный набор видеовыходов: 3 DP и 1 HDMI.

Также следует заметить, что частоты работы у карты MSI чуть повышены относительно референсных значений, но именно чуть-чуть — на 2,3%.

Память

Карта имеет 6 ГБ памяти GDDR6 SDRAM, размещенной в 6 микросхемах по 8 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6) рассчитаны на номинальную частоту работы в 3000 (12000) МГц

Охлаждение и нагрев

Главной частью системы охлаждения под названием TwinFrozr 7 является довольно большой никелированный радиатор, пронизанный тепловыми трубками. Поверх установлен кожух с двумя вентиляторами Torx 3.0 (имеющими особую форму крыльчаток, помогающую ускорить воздушный поток без увеличения шума, и работающими на одинаковой частоте вращения). Вентиляторы останавливаются в случае простоя карты (при температуре

Полный текст статьи читайте на iXBT