Обзор NVIDIA GeForce GTX TITAN Z: в этот раз было нелегко

Двухпроцессорная графическая карта была обязательным пунктом в списке планов NVIDIA начиная с серии GeForce 7000. Запуск видеоадаптера на базе двух GPU GK110 был ожидаем с тех пор, как появились первые потребительские продукты на базе этого процессора. Однако с точки зрения человека, непосвященного в планы NVIDIA, перспективы такого устройства выглядели неоднозначно. Уж слишком велики и цена, и энергопотребление столь крупных GPU, изготовленных по техпроцессу 28 нм.

Топовые видеоадаптеры NVIDIA  в текущем поколениистали беспрецедентно дорогими. Если рекомендованная цена GeForce GTX 780 Ti составляет $699, то сколько же должен стоить двухпроцессорный флагманский адаптер? Неудивительно, что в конце концов видеокарта с двумя чипами GK110 так и не появилась в игровой линейке GeForce 700, но вышла под маркой TITAN.

Семейство GeForce GTX TITAN имеет для NVIDIA двойное назначение. С одной стороны, в «Титаны» попадают продукты для геймеров-энтузиастов, обладающие максимальной игровой производительностью. Оригинальный GTX TITAN какое-то время был единственным продуктом на базе GK110. Сменивший его GTX TITAN Black просто работает на более высоких частотах по сравнению с GeForce GTX 780 Ti.

С другой стороны, TITAN — это высокопроизводительные устройства для вычислений в профессиональных областях. В то время как концепция GPGPU получает все более широкое распространение и признание, покупатель уже не может получить максимальную производительность в «счетных» задачах в нагрузку к игровому GPU, как это было в предыдущие годы.

NVIDIA заложила разделение по расчетным возможностям в саму архитектуру GPU. Операции с плавающей точкой двойной точности (FP64) в чипах Kepler выполняются специальным ядрами CUDA. И только GK110 из всей линейки имеет 64 FP64-совместимых ядра CUDA в каждом блоке SMX (Streaming Multiprocessor). Поскольку SMX содержит 192 обычных ядра, выполняющих операции одинарной точности, производительность GK110 в расчетах FP64 составляет ⅓ от производительности в расчетах FP32.

Все остальные GPU в линейке Kepler довольствуются восемью FP64-совместимыми ядрами CUDA в каждом SMX, что дает производительность на уровне всего лишь 1/24 от FP32. Но кроме того, в игровых моделях GeForce на базе GK110 ядра FP64 работают на частоте 1/8 от частоты GPU, что приводит все к тому же соотношению производительности FP64 к FP32 — 1/24. Только «Титаны» лишены этого ограничения, обладая максимальным для GK110 быстродействием в FP64.

Фактически по вычислительным возможностям TITAN Black не уступает профессиональным ускорителям Quadro K6000 и Tesla K40, которые также основаны на полностью функциональной ревизии чипа GK110, только стоят свыше 4 тыс. долларов.

Таким образом, видеоадаптер с двумя GK110 должен позиционироваться в качестве ускорителя для научных, финансовых и инженерных вычислений — всех тех задач, в которых используются операции двойной точности. И для него вполне оправдано четырехзначное число на ценнике. С другой стороны, мы имеем новый фетиш для энтузиастов и статусный продукт, который поддерживает заявку NVIDIA на лидерство в традиционной сфере применения GPU — 3D-графике и компьютерных играх.

В этом качестве GeForce GTX TITAN Z встретил сильного конкурента в лице Radeon R9 295×2 на базе двух чипов Hawaii. Двухпроцессорный флагман AMD не уступает в производительности двум отдельным адаптерам Radeon R9 290X и одновременно стоит вдвое дешевле, чем TITAN Z. Единственное слабое место R9 295×2 в противостоянии с TITAN Z ­– скорость вычислений двойной точности.

Процессор Hawaii включает полностью аппаратные планировщики, выполняющие разрешение зависимостей и формирование очереди операций — в отличие от архитектуры Kepler, в которой эту функции возложены на драйвер. Подход AMD более эффективен для расчетных задач, кроме того, в архитектуре GCN все потоковые процессоры способны исполнять FP64-операции за два такта, что дает производительности на уровне ½ от скорости вычислений одинарной точности. Но в десктопных устройствах на базе Hawaii искусственно установлено соотношение 1/8. Полная скорость зарезервирована для профессиональных ускорителей FirePro. Даже собрав систему из двух Radeon R9 295×2 за цену единственного TITAN Z, мы получим ¼ производительности отдельной двухголовой видеокарты в режиме FP64.

⇡#Технические характеристики

Мощность GK110 была главной проблемой для разработчиков GeForce GTX TITAN Z. В прошлый раз, когда флагманским GPU NVIDIA был относительно компактный GPU GK104, удалось создать двухпроцессорную карту — GeForce GTX 690, которая практически не уступала в производительности паре отдельных GTX 680. Повторить это достижение с чипами GK110, которые в составе отдельных адаптеров развивают мощность 250 Вт, — серьезная задача.

AMD решила эту проблему для Radeon R9 295×2 за счет системы водяного охлаждения. Но GeForce GTX TITAN Z использует воздушный кулер, явно неспособный отвести от платы 500 Вт тепла. Карта имеет TDP 375 Вт — ровно столько, сколько по спецификациям могут обеспечить два восьмиконтактных разъема питания, которыми оснащена карта, в сочетании с разъемом PCI-E x16.

Как следствие, компромисс в тактовых частотах был неизбежен. TITAN Z имеет наименьшую базовую частоту среди всех моделей на базе GK110 — 706 МГц. С другой стороны, у него наибольшая дельта между базовой частотой и boost clock — 180 МГц, которая дает карте пространство для ускорения в благоприятных условиях. GPU даже способен на короткие броски к частоте 1058 МГц — на 352 МГц выше базовой! Видеопамять общим объемом 12 Гбайт работает на эффективной частоте, характерной для GTX 780 Ti и TITAN Black, — 7000 МГц.

Модель Графический процессор Видеопамять Шина ввода/вывода Вывод изображения TDP, Вт Кодовое название Число транзисторов, млн Техпроцесс, нм Тактовая частота, МГц: Base Clock / Boost Clock Число ядер CUDA Число текстурных блоков Число ROP Разрядность шины, бит Тип микросхем Тактовая частота: реальная (эффективная), МГц Объем, Мбайт Интерфейсы (макс разрешение@частота кадров, Гц) Порты вывода GeForce GTX 780 GK110 7 100 28 863/900 2304 192 48 384 GDDR5 SDRAM 1502 (6008) 3072 PCI-Express 3.0×16 VGA (2048×1536@85), DL DVI (2560×1600@60), HDMI 1.4a (4096×2160@24), DisplayPort 1.2 (4096×2160@60) 1 х DL DVI-I,1 x DL DVI-D,1 x DisplayPort,1 x HDMI 250 GeForce GTX 780 Ti GK110 7 100 28 875/928 2880 240 48 384 GDDR5 SDRAM 1750 (7000) 3072 PCI-Express 3.0×16 VGA (2048×1536@85), DL DVI (2560×1600@60), HDMI 1.4a (4096×2160@24), DisplayPort 1.2 (4096×2160@60) 1 х DL DVI-I,1 x DL DVI-D,1 x DisplayPort,1 x HDMI 250 GeForce GTX TITAN Black GK110 7 100 28 889/980 2880 240 48 384 GDDR5 SDRAM 1750 (7000) 6144 PCI-Express 3.0×16 VGA (2048×1536@85), DL DVI (2560×1600@60), HDMI 1.4a (4096×2160@24), DisplayPort 1.2 (4096×2160@60) 1 х DL DVI-I,1 x DL DVI-D,1 x DisplayPort,1 x HDMI 250 GeForce GTX TITAN Z GK110 7 100 28 705/876 2880 240 48 2×384 GDDR5 SDRAM 1750 (7000) 2×6144 PCI-Express 3.0×16 VGA (2048×1536@85), DL DVI (2560×1600@60), HDMI 1.4a (4096×2160@24), DisplayPort 1.2 (4096×2160@60) 1 х DL DVI-I,1 x DL DVI-D,1 x DisplayPort,1 x HDMI 375 Судя по объявленным спецификациям, понижение базовой частоты существенно сказалось на скорости карты. Пиковая расчетная производительность GTX TITAN Z составляет 8 TFLOPS, притом что GTX TITAN Black выдает на-гора 5 TFLOPS в FP32.

По конфигурации вычислительных блоков GPU TITAN Z не отличается от TITAN Black. Про графический процессор GK110 более подробно вы можете прочитать статье, посвященной оригинальному GeForce GTX TITAN, а архитектура Kepler в целом описана в обзоре GeForce GTX 680.

⇡#Конструкция

Общие принципы дизайна TITAN Z унаследовал от предыдущей двухголовой видеокарты NVIDIA — GeForce GTX 690, только на этот раз кулер не двух-, а трехслотовый. Кожух системы охлаждения металлический, с прозрачными окошками, в которых видно черные радиаторы GPU. Задняя поверхность платы покрыта толстой алюминиевой пластиной, которая добавляет изрядную долю к общему немаленькому весу устройства. Назначение пластины не только декоративное. Она охлаждает микросхемы памяти, расположенные под ней.

Чисто эстетически «двухголовый Титан» производит сильное впечатление. Топовые однопроцессорные адаптеры NVIDIA, выполненные в таком же дизайне, прекрасно выглядят, но держа в руках TITAN Z, чувствуешь настоящую мощь. Внешность, достойная такого дорогого и совершенного устройства.

Аксиальный вентилятор продувает воздух сквозь отдельные радиаторы, расположенные по сторонам. Не в пример турбинным кулерам, применяемым в однопроцессорных картах NVIDIA референсного дизайна, часть горячего он воздуха он выбрасывает внутрь корпуса ПК. Кроме того, аксиальный вентилятор не позволяет разместить никакую другую плату вплотную к видеоадаптеру, тогда как турбинка при необходимости это допускает. Следовательно, в корпусе TITAN Z оккупирует не три, а все четыре слота расширения. В этом плане двухголовая карта не дает никакого выигрыша по сравнению с двумя GeForce GTX TITAN Black, установленными вплотную друг к другу.

Выхлопная решетка занимает половину крепежной пластины. Оставшаяся площадь использована для видеовыходов — в такой же конфигурации, как и на прочих топовых адаптерах NVIDIA: два порта DVI плюс полноформатные разъемы HDMI и DisplayPort. Поскольку один GPU может использовать четыре порта одновременно, возможности второго остаются незадействованными. В таком классе устройств (и за такие деньги) хотелось бы видеть больше разъемов DisplayPort 1.2 (пусть и в Mini-варианте, как на Radeon R9 295×2). Возможность подключить к одному ПК больше четырех мониторов не так уже важна, но в существующем варианте только один из них может иметь разрешение Ultra HD.

GPU охлаждают довольно компактные радиаторы, но в основание каждого вмонтирована испарительная камера. Металлическая рама покрывает лицевую поверхность платы. Платформа, на которой закреплен вентилятор, представляет собой еще один отдельный радиатор, прижатый к транзисторам системы питания и коммутатору шины PCI-E.

⇡#Плата

По сравнению с GeForce GTX 690 разводка платы радикально усложнилась. Неудивительно, если принять во внимание 384-битную шину памяти каждого GPU и 12 Гбайт RAM. Графические процессоры соединяет коммутатор PCI-E 3.0 PLX PEX8747, которые мы ранее видели на том же GTX 690. Чипы памяти SK hynix H5GQ2H24BFR-R2C рассчитаны на эффективную частоту 7 ГГц.

Система питания не отличается по конфигурации фаз от того, что было в GeForce GTX 690. Каждый GPU получил по пять фаз, две фазы отданы для питания чипов памяти, и еще одна фаза — для PLL. Особенность TITAN Z в том, что принадлежность фаз к отдельным GPU не фиксирована. Один из чипов может в какой-то момент времени пользоваться большим числом фаз, чем другой, если его энергопотребление выше.

Контроллеры питания используются те же, что и в других референсных картах на базе GK110 — ON NCP4206.

Следующая страница →

⇣ Содержание

Виджет от SocialMart

Материалы по теме

Полный текст статьи читайте на 3DNews