На что способны 6 ГБ в Turing: исследуем производительность GeForce GTX 1660 и GeForce RTX 2060

Оглавление

Вступление

500x267 29 KB. Big one: 2500x1334 464 KB

Еще долго участники конференции будут спорить на тему шести гигабайт видеопамяти, и неспроста. Вся предыдущая линейка графических ускорителей NVIDIA среднего и верхнего класса (GeForce GTX 1070, GeForce GTX 1070 Ti и GeForce GTX 1080) оснащалась восемью гигабайтами памяти, а заменившие ее видеокарты обходятся шестью.

Причем сама NVIDIA утверждает об отсутствии проблем с доступностью свободной видеопамяти, и это порождает массу вопросов. Мы разберемся в ситуации, изучив производительность GeForce GTX 1660 и GeForce RTX 2060 с одинаковым объемом памяти.

Выделенная и задействованная память

Так уж повелось, что большинство обзоров, затрагивающих тему видеопамяти, опираются на показания различных утилит. Однако это не является показателем используемой графическим ядром памяти именно в этот момент тестирования. Скорее мы видим объем выделенной для видеоядра памяти. Впрочем, не имея других инструментов, авторам приходится использовать хотя бы такой инструмент сравнения.

Для точного определения объема используемой видеопамяти можно задействовать NVIDIA Nsight Graphics, которая покадрово выдаст искомую величину. Да, такие данные будут интересны, но поскольку программа может выдавать данные только по одному кадру, то цикл разбора одного прохода бенчмарка займет несколько дней. Поэтому мы задействуем Afterburner.

А в качестве подопытных кроликов возьмем две крайних видеокарты из существующей линейки NVIDIA: GeForce GTX 1660 и GeForce RTX 2060. Первая на данный момент является самым младшим решением Turing для игроков и рассчитана на разрешения до 2560×1440. Вторая оснащена более производительным графическим процессором, но ограничена тем же разрешением, потому что ее GPU на большее не способен.

500x352 61 KB. Big one: 917x645 49 KB

Простая наглядная инфографика (приблизительная) по объемам используемой памяти. В зависимости от игры (точнее ее движка) линии могут принимать положения выше или ниже, а также быть изогнутыми. Это все справедливо еще при одном условии — баланс производительности GPU, объема видеопамяти и ее пропускной способности должен быть соблюден.

500x339 37 KB. Big one: 2500x1697 567 KB

Итак, есть две видеокарты одного поколения, пора переходить к выбору необходимых для тестирования программ.

Тестовый стенд

Конфигурация:

500x334 46 KB. Big one: 2500x1668 554 KB
  • Материнская плата: ASUS ROG Maximus XI Hero (Intel Z390, LGA 1151 v2);
  • Процессор: Intel Core i9–9900K (8 ядер, 3600 МГц);
  • Система охлаждения: система водяного охлаждения:
    • Alphacool NexXxoS Monsta 360;
    • Scythe Minebea Silent IC, 2000 об/мин, x 3;
    • EK-XRES 140 Revo D5 PWM;
    • EK-Supremacy Evo;
    • Шланги 15/19;
  • Термоинтерфейс: Arctic Cooling МХ-2;
  • Оперативная память: DDR4 3400 МГц, CL16, 2×8 Гбайт;
  • Накопители:
    • SSD Intel Optane 905P 480 Гбайт;
    • SSD Samsung 960 Evo, 500 Гбайт;
    • SSHD Seagate Desktop 4 Тбайт;
  • Блок питания: Corsair AX1500i Digital, 1500 Ватт.

Программное обеспечение:

  • Операционная система: Microsoft Windows 10×64.

Для минимизации зависимости оперативной памяти ее объем был увеличен до 32 Гбайт. Процессор работает в штатном режиме. Версия драйверов NVIDIA — GeForce 419.67 WHQL.

Подготовка к тестированию

Изначально план теста состоял из запуска встроенных бенчмарков, но позже было принято решение использовать игры по назначению и лично проходить участки, которые занимают как минимум 5–10 минут игрового времени.

К сожалению, не во всех играх удалось это сделать. Например, Far Cry New Dawn не позволяет возобновлять игру с определенной точки (так же, как и Hitman). Впрочем, у последнего отрезок бенчмарка более чем достаточен для оценки. Во всех остальных играх пришлось самостоятельно проходить 5–10 минутный отрезок и постараться максимально точно его повторить при последующих проходах.

Таким образом в пяти играх из семи используются длительные проходы, что даст более точную картину происходящего. Сами тесты проходили в двух разрешениях: 1920×1080 и 2560×1440. Для загрузки памяти во всех играх было принято решение использовать максимальные настройки качества, причем в некоторых можно было даже повысить уровень АА до 2х, так мы и поступили. Увы, не везде это возможно.

Что касается актуальности выбранных игр, то выбор пал на новинки, но не недельной давности, а на те, что получили не по одному патчу, иначе тест превратился бы в борьбу с багами. Естественно, для точного сравнения не использовались возможности RT, DLSS или продвинутые тени. Это либо разгружает GPU, либо, наоборот, перегружает его работой, а объем использованной памяти перестает расти.

Как вы знаете, именно АА дополнительно задействует большие объемы видеопамяти, этим параметром мы и загружали видеокарты. Стоит добавить к описанию количество собираемых данных. Для точности за одну секунду добавлялось четыре строчки с цифрами загрузки памяти, GPU и CPU.

  • Battlefield 5;
  • Metro Exodus;
  • Shadow of the Tomb Raider;
  • Far Cry New Dawn;
  • Hitman;
  • Wolfenstein II The New Colossus;
  • The Witcher 3: Wild Hunt.

VSync при проведении тестов был отключен.

Типы сглаживания

SSAA (Supersample anti-aliasing) — самое тяжелое сглаживание, при четырехкратном сглаживании видеокарта обрабатывает картинку в разрешении вчетверо выше, чем выводит на экран, потом происходит усреднение цвета соседних пикселей и вывод на экран в исходном разрешении. Получается, что виртуальная плотность пикселей вдвое выше, чем у экрана, и лесенки практически перестают быть заметными.

MSAA (Multisample anti-aliasing) — улучшенная версия SSAA, которая потребляет гораздо меньше ресурсов. Если текстура представляет собой прямую линию под углом к игроку, то можно сгладить лишь один участок и продолжить эффект на весь край текстуры. В результате нагрузка на видеокарту становится ощутимо меньше, и по тяжести даже 8х MSAA оказывается легче 4х SSAA при сравнимом качестве картинки.

CSAA и CFAA (Coverage Sampling anti-aliasing и Custom-filter anti-aliasing) — улучшенный MSAA от NVIDIA и AMD. 8x CSAA/CFAA дает сравнимое с 8x MSAA качество картинки, однако потребляет примерно столько же ресурсов, столько и 4х MSAA. На сегодняшний момент оба сглаживания не используются — разработчики игр решили использовать унифицированные для всех видеокарт сглаживания.

FXAA (Fast approXimate anti-aliasing) — нетребовательное быстрое сглаживание. Совершается один проход по всем пикселям изображения и усредняются цвета соседних пикселей. Это слабо нагружает видеокарту, однако сильно мылит картинку, делая далекие объекты вообще неузнаваемыми. Такое сглаживание есть смысл включать, только если лесенки терпеть не можете, а видеокарта не тянет лучшее сглаживание. По сути выбор между замыливанием изображения и лесенками.

MLAA (MorphoLogical anti-aliasing) — аналог FXAA от Intel. Работает схожим образом, однако алгоритм сложнее. Это единственное сглаживание, работающее полностью на процессоре, поэтому практически не влияет на fps в играх при мощном процессоре. Из-за более сложного алгоритма изображение получается более качественным, чем с FXAA, однако до 2x MSAA все еще далеко.

SMAA (Subpixel Morphological anti-aliasing) — смесь FXAA и MLAA. По сути несколько улучшенный MLAA, но работающий на видеокарте (так как процессор для сглаживания подходит гораздо хуже). Дает картинку, сравнимую с MLAA, лучше, чем FXAA (обратите внимание на бочки), однако потребляет больше ресурсов: такое сглаживание является хорошей заменой FXAA.

TXAA (Temporal antialiasing) — новая технология сглаживания от Nvidia. В отличие от других типов сглаживания, которые работают только с одним кадром, этот умеет работать с движущимися объектами и хорошо убирает мельтешение картинки. По сути является смесью MSAA и SMAA, дает очень качественную картинку, однако мылит ее и очень требователен к ресурсам.

Результаты тестирования

Battlefield V

Настройки:

  • Разрешение — 1920×1080, 2560×1440;
  • Угол обзора/техники — 55;
  • Размытие в движении — 50%;
  • Эффект глубины резкости (прицел) — нет;
  • Хроматическая аберрация — да;
  • Зернистость изображения — да;
  • Виньетка — да;
  • Оптическая дисторсия — да;
  • DX12 — да;
  • DXR — нет;
  • RTX DLSS — нет;
  • HDR — нет;
  • Разрешение — 100%;
  • Рендеринг последующих кадров — да;
  • Вертикальная синхронизация — нет;
  • Ограничение памяти графического процессора — нет;
  • Качество графики — ультра;
  • Сглаживание — ТАА высокое;
  • Глобальное затенение — HBAO.

В игре базовое Temporal Anti_Aliasing и HBAO тени.

391x500 59 KB. Big one: 946x1211 55 KB
390x500 69 KB. Big one: 945x1211 60 KB

Как мы видим, Battlefield V не требует много видеопамяти и вполне обходится < 4.5 ГБ. Обе видеокарты выдают приемлемое количество к/с, и играть можно без проблем.

Что касается оперативной памяти, то часть ее используется самой Windows и запущенными программами, а это около 4 ГБ. Вычитаем из максимально задействованного объема эти 4 ГБ и получаем около 6.5 ГБ.

390x500 57 KB. Big one: 946x1212 52 KB
390x500 64 KB. Big one: 946x1212 58 KB

При переходе к разрешению 2560×1440 показываемый объем задействованной памяти увеличивается всего до 5 ГБ, что явно противоречит логике. Возьмем для примера разницу в процентах между 1920 и 2560 по пикселям: 2073600 → 3686400. Разница составляет более 75%, а в программе, оценивающей загруженность, она выражается ростом только на 10–15%. Это доказывает нам, что пользоваться переменной загрузки видеопамяти нужно с умом, понимая, что она означает.

Для примера приведу вот такую аналогию: вы строите дом на участке, и вам привезли кирпич. Его выгружают за территорией вашего участка (объем доступный). Далее для строительства вам нужно перенести кирпич на участок и складировать его непосредственно у дома (объем кэшируемый). Но в работе на бригаду рабочих перманентно задействовано от 4 до 10 кирпичей (это используемый объем и его нельзя простыми способами узнать для 3D рендера).

Мы подошли к нерешаемой проблеме — оценке актуального используемого объема видеопамяти. В двух словах — мы видим только доступный объем (это вся память на видеокарте) и кешируемый ГП (не факт, что он весь задействуется).

Metro Exodus

Настройки:

  • Разрешение — 1920×1080, 2560×1440;
  • Качество — экстрим;
  • Размытие — низкое;
  • DirectX — DX12;
  • NVIDIA RTX — выкл.;
  • DLSS — выкл.;
  • Hairworks — вкл.;
  • Детальный PhysX — вкл;.
  • Тесселяция — вкл.;
  • Фильтрация текстур — AF16x;
  • Коэффициент шейдинга — 1Х.

В игре используется Supersample anti-aliasing 10, какой именно коэффициент SSAA — точно неизвестно, а градация возможна от 0 до 10. По теням не подскажу, поскольку настройка r_foliage_hemi_ao 1 ровным счетом ничего не значит (кто в курсе, прокомментируйте).

390x500 54 KB. Big one: 945x1211 53 KB
390x500 61 KB. Big one: 945x1212 58 KB
390x500 49 KB. Big one: 945x1212 50 KB
390x500 55 KB. Big one: 946x1212 53 KB

Shadow of the Tomb Raider

Настройки:

  • Разрешение — 1920×1080, 2560×1440;
  • DirectX — 12;
  • Сглаживание — SMAA;
  • Конфигурация — максимальная;
  • Эффект скорости — вкл.;
  • Засветка — вкл.;
  • Screen Space отражения — вкл.;
  • Блики — вкл.;
  • Эффекты экрана — вкл.;
  • Объемные лучи — вкл.;
  • Замощение — вкл.;
  • Качество текстур — ультра;
  • Фильтрация текстур — анизотропная 8х;
  • Качество теней — высокое;
  • Качество теней, созданных NVIDIA DXR — выкл.;
  • Глубина резкости — высокая;
  • Детализация — высокая;
  • Затенение фонового света — HBAO+;
  • Pure Hair — среднее;
  • Screen space contact shadows — среднее.

Выбран готовый пресет настроек «Максимальный». Тип АА и АО выбран максимально подходящий для данного типа видеокарт. Последующее увеличение качественного составляющего загружает видеокарту до такой степени, что комфортный FPS падает <40.

390x500 58 KB. Big one: 946x1212 61 KB
390x500 63 KB. Big one: 945x1212 67 KB
391x500 52 KB. Big one: 946x1211 53 KB
390x500 64 KB. Big one: 946x1212 60 KB

Ради интереса все настройки были увеличены до Ультра, в том числе включены DRX тени и SMAA 4x. И все же количество задействованной видеопамяти не показатель. Я специально отобрал один проход в 1920 с одним небольшим лагом, но из 10 проходов он такой один и связан с запоминанием точки сюжета на HDD.

390x500 61 KB. Big one: 945x1211 65 KB
390x500 57 KB. Big one: 946x1212 59 KB

Даже в пиковых нагрузках, когда RTX 2060 еле шевелится, по fps загрузка не превышает 5.5 ГБ и нет никаких фризов и резкого падения.

Far Cry New Dawn

Настройки:

  • Разрешение — 1920×1080, 2560×1440;
  • Качество графики — максимум;
  • Фильтрация текстур — максимум;
  • Тени — максимум;
  • Геометрия мира и растительности — максимум;
  • Окружение — максимум;
  • Вода — высокий;
  • Ландшафт — высокий;
  • Объемный туман — высокий;
  • Текстуры HD — вкл.;
  • Сглаживание — SMAA;
  • Размытие в движении — вкл.;
  • Масштаб поля зрения — 75.
390x500 38 KB. Big one: 945x1211 51 KB
390x500 40 KB. Big one: 945x1212 52 KB
390x500 40 KB. Big one: 946x1212 51 KB
390x500 39 KB. Big one: 946x1212 51 KB

Hitman

Настройки:

  • Разрешение — 1920×1080, 2560×1440;
  • Версия DX12;
  • Суперсемплинг — 2x;
  • Уровень детализации — ультра;
  • Сглаживание — SMAA;
  • Качество текстур — высокое;
  • Фильтрация текстур — анизотропная 16;
  • SSAO — включено;
  • Качество теней — ультра;
  • Разрешение теней — высокое;
  • Отключить защиту памяти — нет.
391x500 42 KB. Big one: 945x1210 55 KB
390x500 51 KB. Big one: 945x1212 60 KB
390x500 43 KB. Big one: 946x1212 52 KB
390x500 48 KB. Big one: 946x1212 56 KB

Wolfenstein II The New Colossus

Настройки:

  • Разрешение — 1920×1080, 2560×1440;
  • Качество видео — Майн лебен;
  • Размытие в движении — вкл.;
  • Сглаживание — TSSAA (8TX).
390x500 46 KB. Big one: 946x1212 55 KB
390x500 50 KB. Big one: 945x1211 58 KB
390x500 42 KB. Big one: 945x1212 50 KB
390x500 48 KB. Big one: 946x1212 54 KB

The Witcher 3: Wild Hunt

Настройки:

  • Разрешение — 1920×1080, 2560×1440;
  • Размытие при движении — включено;
  • Размытие — включено;
  • Сглаживание — включено;
  • Свечение — включено;
  • Повышенная четкость — высокая;
  • Рассеянное затемнение –SSAO;
  • Глубина кадра — включено;
  • Хроматическая аберрация — включено;
  • Виньетирование — включено;
  • Световые шахты — включено;
  • Кадров в секунду — без ограничений;
  • NVIDIA HairWorks — включено;
  • NVIDIA HairWorks АА — 4;
  • Настройка NVIDIA Hairworks — высокое;
  • Число персонажей на экране — запредельное;
  • Качество теней — запредельное;
  • Качество рельефа — запредельное;
  • Качество воды — запредельное;
  • Количество травы — запредельное;
  • Качество текстур — запредельное;
  • Дальность видимости растительности — запредельное;
  • Качество детализации — запредельное.
390x500 47 KB. Big one: 946x1212 54 KB
390x500 47 KB. Big one: 945x1211 55 KB
390x500 42 KB. Big one: 945x1212 47 KB
391x500 48 KB. Big one: 946x1211 55 KB

Заключение

500x292 33 KB. Big one: 2500x1460 415 KB

Не так страшен черт, как его малюют… По результатам проведенного теста видно, что в самых популярных разрешениях современные игры прекрасно обходятся шестью гигабайтами видеопамяти. Продвинутые алгоритмы сжатия, достаточная ПСП и внутренние оптимизации GPU позволяют новинкам NVIDIA, начиная с GeForce GTX 1660 и выше, прекрасно себя чувствовать при любых настройках.

В итоге выбор объема набортной памяти обусловлен достаточностью, а не экономией, впрочем, и ей тоже! За счет установки 6 ГБ разработчики NVIDIA грамотно развели младшие и старшие модели видеокарт по ценовым сегментам. В противном случае GeForce RTX 2060 вполне смогла бы побороться за место под солнцем в 4К разрешении при средних настройках качества в играх.

А так, удалось сэкономить на блоках ROP, контроллерах и объеме видеопамяти, и не пасть лицом в грязь. Мощность графических процессоров Turing TU116 и TU106 сбалансирована с объемом установленной памяти на все 100%.

Rasamaha (Дмитрий Владимирович)


testedby.png

Выражаем благодарность за помощь в подготовке материала:

  • Компании NVIDIA за предоставленные на тестирование видеокарты.
  • А также лично donnerjack.


Полный текст статьи читайте на overclockers.ru