GTX — больше не «ПЕЧ». Обзор видеокарт NVIDIA GeForce GTX 980 и GeForce GTX 970
«Геймеры готовы к Maxwell» — именно с таким лозунгом начала свою презентацию NVIDIA. И неудивительно. Видеокарты на основе архитектуры Kepler просуществовали без малого 2,5 года. И просуществуют еще, ибо решения на основе графического чипа GK110 будут и дальше продаваться. В этом году так точно. Зимой этого года NVIDIA уже представила первые две разработки на основе чипов, построенных на новой Maxwell — видеокарты GeForce GTX 750 и GeForce GTX 750 Ti. Однако, как вы уже догадались, эти устройства относятся к семисотой линейке. Во-вторых, они являются яркими представителями сегмента Low-End. Человечество же ждало топа и дождалось: встречаем GeForce GTX 980 и GeForce GTX 970!
Геймеры готовы к Maxwell!
Признаюсь честно, я ждал появления флагманских видеокарт NVIDIA с большим нетерпением. Во-первых, потому что после выпуска сверхэффективной 60-ваттной GeForce GTX 750 Ti было очень интересно узнать, на что способен более крупный Maxwell. Во-вторых, было интересно посмотреть на стратегию NVIDIA: выкатит ли она сразу флагманскую модель или же поэкспериментирует с очередным решением попроще. Истина, как это часто бывает, оказалась где-то посередине.
Забавно, что NVIDIA оставила без внимания линейку GeForce GTX 800 и сразу же представила GeForce GTX 980
Кстати, фотография выше — это отличные обои для рабочего стола.
Maxwell vs Kepler Прошло больше двух лет, но GeForce GTX 680 до сих пор считается одной из самых популярных видеокарт. Если быть более точным, то популярной считается ее переименованная версия — GeForce GTX 770, но не суть. Так как очень схожую индексацию получили и чипы, и сами устройства (хотя маркетинговый «разрыв» сразу в целых три поколения выглядит очень вызывающе), то логично сравнить именно их. Ниже приведена эволюция модульной архитектуры во всей красе.
Maxwell (GeForce GTX 980)
Kepler (GeForce GTX 680)
Чип
GM204
GK104
Число транзисторов
5,2 млрд
3,5 млрд
Техпроцесс
28 нм
28 нм
Число потоковых мультипроцессором SM
16
8
CUDA-ядер
2048
1536
Частота GPU
1126/1216 МГц
1006/1058 МГц
Производительность
5 ТФЛОПС
3,3 ТФЛОПС
Эффективная частота памяти
7000 МГц
6000 МГц
Пропускная способность памяти
224 Гбайт/с
192 Гбайт/с
ROP
64
32
Уровень TDP
165 Вт
195 Вт
Занимательная картина: процессор GM204 состоит из 5,2 млрд транзисторов, что на 1,7 млрд больше, чем у GK107, работает на 120 МГц быстрее, но при этом GeForce GTX 980 потребляет на 30 Вт меньше энергии. Этому поспособствовала и сама интеграция архитектуры Maxwell, и отладка 28-нанометровых «рельс». Как видите, из этих технологических нормативов выжаты далеко не все соки. Порох в пороховницах имеется, причем не сырой.
Подробно описывать особенности архитектуры Maxwell я не буду. В свое время мы сделали это, анализируя видеокарту GeForce GTX 750 Ti: «Часть №1: первые решения на архитектуре Maxwell»; «Часть №2: новые подробности архитектуры Maxwell». Не вижу смысла повторяться.
Сравнение NVIDIA GeForce GTX 680, NVIDIA GeForce GTX 780 и NVIDIA GeForce GTX 980 друг с другом
Итак, основой GeForce GTX 980 служит графический процессор GM204. Это более сложный чип, хотя бы потому, что он имеет большую полезную площадь и, как следствие, большее число транзисторов. Напомню, что GM107 состоит из 1,87 миллиарда кремниевых затворов. А здесь их уже 5,2 миллиарда, то есть в 2,8 раз больше.
NVIDIA GeForce GTX 980
К тому же сам «камень» был несколько видоизменен. Если в GM107 используется один кластер графики, содержащий пять потоковых мультипроцессоров SMM, то в GM204 задействовано восемь кластеров графики, в каждом из которых содержится по четыре SMM.
Графический процессор GM204 собственной персоной
Итого получается, что GM204 имеет шестнадцать потоковых мультипроцессоров. В каждом SMM находится по 128 CUDA-ядер. Следовательно, общее количество вычислительных ALU равно 2048. Плюс к SMM привязаны текстурные блоки и ROP. Так, GM204 насчитывает 128 TMU и 64 ROP соответственно. Как всегда, графический процессор оснащен объемным кэшем второго уровня, равным 2 Мбайт. А четыре 64-битных встроенных контроллера памяти организуют 256-битную шину.
Кластер GPC состоит из шестнадцати SMM
Если в Kepler каждый SM-блок считался самодостаточной единицей, то в Maxwell он дополнительно разделен на четыре части. Каждый модуль имеет 32 CUDA-ядра, блок обработки, буфер команд и планировщик. На две таких части приходится четыре текстурных блока, а также кэш первого уровня (что-то похожее мы могли наблюдать в G80). Подобное разделение упрощает логику процессора, экономит площадь кристалла и, конечно же, уменьшает потребляемую электроэнергию.
А это сам SMM
В итоге один SMM в сравнении с Kepler SM работает на 40% эффективнее, но при этом затрачивает меньше энергии.
Графический процессор GM204 имеет 64 ROP. Это вдвое больше, чем у GK104. Каждый блок ROP может обрабатывать один цвет. Для уменьшения требований к видеопамяти был задействован метод компрессии без потерь. Архитектура Maxwell поддерживает уже третье поколение дельта-сжатия (первое было реализовано в Fermi). В проведенных тестах GeForce GTX 980 использует приблизительно на 25% меньше байтов на кадр, чем GeForce GTX 680.
Разница в производительности между GeForce GTX 980 и GeForce GTX 680 видна невооруженным взглядом. Быстродействие GM204 (особенно в сверхтяжелых режимах) может достигать двух-, а то и трехкратного превосходства.
Технические характеристики В следующей табличке я разместил более современные видеокарты, а также основных конкурентов GeForce GTX 970 и GeForce GTX 980 — AMD Radeon R9 290 и AMD Radeon R9 290X.
NVIDIA GeForce GTX 970
NVIDIA GeForce GTX 980
NVIDIA GeForce GTX 750 Ti
NVIDIA GeForce GTX 770
NVIDIA GeForce GTX 780
NVIDIA GeForce GTX 780 Ti
AMD Radeon R9 290
AMD Radeon R9 290X
Название процессора
GM204
GM204
GM107
GK104
GK110
GK110
Hawaii
Hawaii
Техпроцесс
28 нм
28 нм
28 нм
28 нм
28 нм
28 нм
28 нм
28 нм
Архитектура
Maxwell
Maxwell
Maxwell
Kepler
Kepler
Kepler
GCN
GCN
Число потоковых процессоров
1664
2048
640
1536
2304
2880
2560
2816
Число текстурных блоков
104
128
40
128
192
240
160
176
Число блоков растеризации
64
64
16
32
48
48
64
64
Частота ядра
1050 (1178) МГц
1126 (1216) МГц
1020 (1085) МГц
1046 (1085) МГц
863 (900) МГц
875 (928) МГц
947 МГц
1000 МГц
Память
GDDR5, 4 Гбайт
GDDR5, 4 Гбайт
GDDR5, 2 Гбайт
GDDR5, 2 Гбайт
GDDR5, 3 Гбайт
GDDR5, 3 Гбайт
GDDR5, 4 Гбайт
GDDR5, 4 Гбайт
Шина
256 бит
256 бит
128 бит
256 бит
384 бит
384 бит
512 бит
512 бит
Частота памяти
1750 (7000) МГц
1750 (7000) МГц
1350 (5400) МГц
1753 (7012) МГц
1502 (6008) МГц
1750 (7000) МГц
1250 (5000) МГц
1250 (5000) МГц
Максимальное энергопотребление
145 Вт
165 Вт
60 Вт
230 Вт
250 Вт
250 Вт
290 Вт
290 Вт
Видеовыходы
1x DVI, 1x HDMI, 3x DisplayPort
1x DVI, 1x HDMI, 3x DisplayPort
2x DVI 1x mini-HDMI
2x DVI, 1x HDMI, 1x DisplayPort
2x DVI, 1x HDMI, 1x DisplayPort
2x DVI, 1x HDMI, 1x DisplayPort
2x DVI, 1x HDMI, 1x DisplayPort
2x DVI, 1x HDMI, 1x DisplayPort
Поддерживаемые API
DirectX 12 OpenGL 4.3
DirectX 12 OpenGL 4.3
DirectX 12 OpenGL 4.3
DirectX 12 OpenGL 4.3
DirectX 12 OpenGL 4.3
DirectX 12 OpenGL 4.3
DirectX 12 OpenGL 4.3
DirectX 12 OpenGL 4.3
Цена
14 990 руб.
23 990 руб.
5500 руб.
12 000 руб.
18 000 руб.
25 000 руб.
16 000 руб.
21 000 руб.
Price.ru Запрос цены: NVIDIA GeForce GTX 97059031
Запрос цены: NVIDIA GeForce GTX 98059031
Запрос цены: NVIDIA GeForce GTX 750 Ti59031
Запрос цены: NVIDIA GeForce GTX 77059031
Запрос цены: NVIDIA GeForce GTX 78059031
Запрос цены: NVIDIA GeForce GTX 780 Ti59031
Запрос цены: AMD Radeon R9 29059033
Запрос цены: AMD Radeon R9 290×59031
NVIDIA GeForce GTX 750 Ti приведена здесь исключительно для сравнения. Она создана на базе графического процессора GM107, который, как известно, имеет всего один кластер графики, но пять SMM.
Если сравнить GeForce GTX 980 с более производительными собратьями, а именно с GeForce GTX 780 и GeForce GTX 780 Ti, то на первый взгляд может показаться, что новинка на Maxwell-архитектуре будет медленнее Kepler. Однако это не совсем так. Познакомившись с GeForce GTX 750 Ti, мы узнали, что Maxwell обладает в 2,3 раза большей шейдерной производительностью. А еще GM204 работает на гораздо более высокой частоте (на 216 МГц быстрее). А еще ROP в два и полтора раза больше соответственно. А еще у видеокарты 4 Гбайт видеопамяти. Поэтому логично предположить, что GeForce GTX 980 должна быть существенно быстрее GeForce GTX 780 и очень близка по быстродействию к GeForce GTX 780 Ti.
Сама NVIDIA называет графический процессор GM204 самым быстрым в мире. Впрочем, всё это мы обязательно проверим.
Скриншот GPU-Z видеокарты NVIDIA GeForce GTX 980
GeForce GTX 970 Вторая представленная видеокарта — это GeForce GTX 970. Она призвана конкурировать с Radeon R9 290. Урезанный GM-процессор (13 SMM) получил 1664 CUDA-ядра, 104 текстурных блока и 64 ROP. Так же, как и GeForce GTX 980, 3D-ускоритель обзавелся 4 Гбайт видеопамяти, функционирующей на эффективной частоте 7000 МГц. Логично, что потребляет GeForce GTX 970 несколько меньше — всего 145 Вт.
Сравнение NVIDIA GeForce GTX 970 с NVIDIA GeForce GTX 980
Внешне GeForce GTX 970 в референсном исполнении выглядит, как и остальные графические адаптеры NVIDIA.
И еще немного обоев для рабочего стола
Новые возможности Maxwell Помимо представленных видеокарт, NVIDIA анонсировала ряд технологий и функций, направленных на улучшение графики, а также оптимизацию производительности.
Компьютерных игр масса. Какие-то обладают отличным качеством графики, но при этом являются достаточно ресурсоемкими. Какие-то, наоборот, весьма щадяще относятся к железу геймера. Однако и уровень графики у них ниже. В NVIDIA вознамерились решить эти две проблемы, выпустив сразу две технологии: Dynamic Super Resolution и режим сглаживания Multi-Frame sampled (MFAA).
Мониторы и телевизоры, поддерживающие 4К-разрешение, — это очень модный тренд. Однако, во-первых, не всем нужно такое устройство. Во-вторых, не у всех есть возможность приобрести себе 4К-монитор. В-третьих, уровень производительности одночиповых видеокарт таков, что они не справляются с современными играми при максимальных настройках графики. Dynamic Super Resolution — это промежуточное решение, позволяющее улучшить качество картинки. Если говорить грубо, то DSR позволяет поместить 4К-изображение в Full HD. То есть технология чем-то похожа на даунсемплинг. Задействуется фильтр Гаусса с размером ядра фильтра 13.
Принцип работы Dynamic Super Resolution
О качестве такого метода вы можете судить по скриншотам, расположенным ниже.
Функция будет автоматически доступна в утилите GeForce Experience. На мой взгляд, DSR будет полезна для относительно стареньких игр, которые будут запускаться при разрешении Full HD. А вот с новыми могут возникнуть проблемы из-за пост-обработки. В любом случае, если программа поддерживает DSR, то об этом сообщит GeForce Experience. К тому же технология может быть настроена в драйвере, начиная с версии 343.
Отмечу, что DSR поддерживается всеми современными видеокартами GeForce.
Автоматическая поддержка в GeForce Experience
Концепт работы сглаживания MFAA прост: сопоставимое качество антиалиазинга с MSAA, но при этом более быстрая работа. Уже из названия понятно, что данный вид сглаживания — многократный. То есть видеокарта обрабатывает не 16 образцов в клетке 2×2, а вдвое меньше, потому что остальная половина чередуется во времени и пространстве.
Компанией заявлен 30-процентный рост быстродействия. Однако режим MFAA все еще находится в стадии разработки, и более подробная информация о нем, а также возможность самостоятельно протестировать новую технологию, появится позже. Пока же известно, что MFAA будут поддерживать только GPU семейства GM2xx.
MFAA на 30% быстрее MSAA
Обработка света — одна из самых тяжелых задач для компьютерной графики. С выходом видеокарт GeForce GTX 980 и GeForce GTX 970 калифорнийская компания вводит технологию Voxel Global Illumination (VXGI), разработанную Кириллом Крассиным еще в 2011 году. Суть технологии заключается в использовании 3D-структуры вокселей для захвата помещения и освещения каждой точки сцены. Как известно, вокселы являются аналогами пикселов для трехмерного пространства. В принципе, технология могла быть полномасштабно реализована еще 2,5 года назад, одновременно с анонсом GeForce GTX 680. Однако все это время VXGI дорабатывалась. И уже сейчас NVIDIA обещает более высокую производительность. Причем на программном уровне будут поддерживаться все современные видеокарты NVIDIA. А в решениях Maxwell VXGI будет работать на аппаратном уровне.
NVIDIA отмечает рост популярности технологий виртуальной реальности. Решения на основе Maxwell будут заметно быстрее работать с очками Oculus Rift. За счет применения перечисленных выше технологий будет гораздо ниже латентность.
Составляющие VR Direct
А самое главное — это поддержка компьютерных игр. Вот так будет выглядеть EVE VALKYRIE.
EVE VALKYRIE поддерживает Oculus Rift
Кстати, об играх. Как всегда, в кооперации с NVIDIA сотрудничают крупнейшие разработчики. Так, компания Ubisoft продемонстрировала технологичные скриншоты из Assassins Creed Unity и Far Cry 4. Задействованы такие функции, как HBAO+, TXAA, PCSS, тесселяция и другие. О качестве картинки можете судить по скриншотам ниже.
Скоро поклонников PC-игр ждет много новинок. Одна технологичнее другой! Часть из них обязательно добавим в обновленную методику тестирования.
Ближайшие анонсы компьютерных игр, а также эффекты, которые будут поддерживаться
Референcный образец GeForce GTX 980 От теории переходим к практике. Конструктивные особенности референсной модели — самое скучное, на мой взгляд, что есть у GeForce GTX 980. Здесь применяется хорошо знакомый классический кулер турбинного типа. С другой стороны, данная система охлаждения ранее отлично зарекомендовала себя. Поэтому смысла придумывать «зеленым» велосипед нет. Предлагаю подивиться, какая получилась «красавица». По традиции в основе корпуса лежат такие материалы, как алюминий, магниевый сплав и органическое стекло.
Отличить референс GeForce GTX 980 от другой дефолтной модели NVIDIA позволит лишь надпись на кожухе. Карта по-прежнему занимает два слота. А на торце красуется LED-индикатор GEFORCE GTX, светящийся во время работы завораживающим едко-зеленым цветом.
Видеокарта подключается к блоку питания при помощи двух 6-пиновых разъемов.
NVIDIA GeForce GTX 980
Претерпела изменения оборотная сторона. Точнее, она обзавелась пластиковым бекплейтом. Далее я еще рассмотрю целесообразность его применения, однако я всегда приветствую использование таких пластин. Во-первых, они увеличивают жесткость конструкции. Во-вторых, предотвращают повреждение элементов видеокарты. Так, оборотная сторона GeForce GTX 980 имеет большое число конденсаторов.
Бекплейт оснащен съемной частью. Согласно задумке инженеров, ее необходимо демонтировать, когда в системе используется сразу несколько видеокарт. Плюс съемная часть открывает доступ к контактным площадкам.
Кстати, GeForce GTX 980 по-прежнему использует разъемы MIO для объединения в массивы SLI и 3-Way SLI.
I/O-панель, на мой взгляд, располагает идеальным сочетанием портов, а также их количеством. Здесь есть один DVI, один HDMI и сразу три DisplayPort. В качестве воздуховода используется такая же решетка, как у GeForce GTX TITAN Z. Отмечу, что реализован HDMI именно версии 2.0. Следовательно, видеокарта отлично подружится с современными 4К-телевизорами.
NVIDIA GeForce GTX 980, I/O-панель
В конструкции GeForce GTX 980 используется собственная печатная плата. То есть это не готовые PCB GeForce GTX 780 и GeForce GTX 780 Ti. Об этом можно судить хотя бы по расположению фаз питания и драйверов. Используется 5 фаз. Четыре предназначены для GPU, еще одна — для памяти. Видно, что на PCB оставлены две пустые колодки. Видимо, данная печатная плата будет использоваться в других Maxwell-видеокартах (GeForce GTX 980 Ti, GeForce GTX TITAN II? — прим. предвкушающего что-то новенькое автора). Для сравнения: GeForce GTX 780 Ti имеет 6+2=8 фаз.
Процессор семпл-образца получил рабочее название T6A996.0A0. 4 Гбайт памяти образуются за счет использования восьми микросхем GDDR5 от Samsung.
Все самое интересное — впереди, а точнее, на следующей странице обзора.
Страница №2: Тестирование, выводы
Полный текст статьи читайте на Ferra.ru