Профессиональные видеокарты NVIDIA Quadro P6000 и P5000: обзор и тестирование
Введение
Архитектура NVIDIA Pascal уже далеко не в новинку: первые продукты на её основе в виде ускорителей вычислений Tesla и игровых видеокарт GeForce GTX тысячной серии появились на рынке весной 2016. И вполне закономерно, что со временем графические процессоры наиболее современного поколения добрались и до линейки Quadro, которая объединяет ускорители для рабочих станций. Формально они были объявлены ещё полгода назад, на конференции SIGGRAPH 2016, однако в реальности путь новых профессиональных графических решений на рынок оказался не таким быстрым из-за необходимости оптимизации программного обеспечения и сертификации ускорителей у разработчиков инженерных пакетов. В результате, реальное появление новых карт Quadro, построенных на GPU семейства Pascal, состоялось только теперь. А раз так, то самое время подробно познакомиться с теми возможностями, которые они предлагают. Примерно полгода тому назад мы подробно тестировали всю линейку современных графических ускорителей Quadro, но самые свежие её представители тогда основывались на архитектуре Maxwell 2. Теперь же настало время посмотреть, насколько сильно шагнул прогресс в области профессиональной графики за самое последнее время.
В части профессиональных графических решений NVIDIA старается выдерживать не слишком интенсивный график обновлений флагманских продуктов. Новые версии высокопроизводительных видеокарт для рабочих станций выходят в среднем раз в два года. Но сказать, что кто-то сильно проигрывает от такого размеренного темпа, было бы совершенно неверно. Конечно можно думать, что постоянные смены лидеров в линейке Quadro не происходят из-за того, что NVIDIA смогла занять чуть ли не монопольное положение на рынке графических ускорителей для инженерного применения. И скорее всего, такая аргументация тоже имеет какое-то значение. Но более важную роль здесь играет другой мотив: флагманские карты семейства Quadro — весьма дорогостоящие продукты, поэтому их покупатели нуждаются в защите инвестиций, и подталкивать их к частой модернизации систем — не самый правильный подход, который вряд ли пробудит у них лояльность. Поэтому нет ничего удивительного в том, что прошлый флагманский ускоритель Quadro M6000, который относится к поколению Maxwell 2, пришёл на рынок в начале 2015 года, и с тех пор он неизменно оставался лучшим вариантом для систем трёхмерного моделирования и автоматизированного проектирования. Правда, в начале 2016 в ответ на появление AMD FirePro W9100 его косметически обновили добавлением видеопамяти, но что-то принципиально лучшее для рабочих станций — новый ускоритель Quadro P6000 — NVIDIA выпустила лишь сейчас.
Погоня за высокой производительностью в сфере профессиональных ускорителей постепенно утрачивает смысл и по другой причине. Дело в том, что нагрузка, которую создают CAD/CAM-системы в окнах проекции, не столь высока для того, чтобы вскрывать недостаток быстродействия даже у видеокарт уровня ближе к среднему. Как показывают проводимые нами тестирования, оптимальную производительность в системах трёхмерного моделирования и автоматизированного проектирования показывают ускорители класса Quadro M4000. Более же мощные видеокарты могут быть нужны лишь при работе с очень сложными высокодетализированными моделями, которые редко встречаются в реальной жизни. И эта ситуация не меняется ни с выходом новых версий программных пакетов, ни с переходом в 4K-разрешения, ни со включением сглаживания линий. Рабочая среда CAD/CAM-систем порождает сравнительно простую графическую нагрузку, суть которой, фактически, сводится к элементарным геометрическим преобразованиям, наложениям несложных текстур и использованию простых моделей освещённости. Ни о каких же шейдерных операциях или о какой-либо постобработке, естественно, речь почти никогда не идёт. Поэтому многие профессиональные инженеры попросту не имеют стимула к модернизации своих систем и к миграции на новые флагманские ускорители.
Тем не менее, NVIDIA достаточно эффективно борется с последней тенденцией, открывая перед высокопроизводительными графическими ускорителями серии Quadro, о которых идёт речь в данной статье, новые сферы применения. Сегодняшние Quadro — это уже не простое аппаратное средство для повышения комфорта при работе в окнах проекции CAD/CAM-систем. Теперь эти ускорители готовы взвалить на себя и задачи финального рендеринга, и математического моделирования, и даже создания и обработки мультимедийного контента. Иными словами, современные профессиональные ускорители Quadro — это уже не просто узкоспециализированные видеокарты. Сегодня они претендуют на то, чтобы стать куда более универсальными рабочими инструментами для инженеров, дизайнеров, специалистов по моделированию или монтажёров. Поэтому в нашем очередном тестировании мы наряду с традиционной проверкой скорости работы новинок в окнах проекции взглянем и на открывающиеся возможности в других областях.
NVIDIA Quadro P6000 и P5000 в подробностях
В то время как с игровыми видеокартами NVIDIA старается проводить смену поколений архитектуры во всех ценовых сегментах в достаточно сжатые сроки, в части профессиональных ускорителей компания придерживается противоположной стратегии. К данному моменту компанией NVIDIA начаты продажи только двух ускорителей серии Quadro, основанных на архитектуре Pascal. Это — флагманская модель P6000 и субфлагман P5000, которые приходят на смену предшественникам Quadro M6000 и M5000. Более же дешёвые профессиональные видеокарты пока продолжают основываться на процессорах поколения Maxwell. Причём, такая ситуация сохранится ещё как минимум пару месяцев. Хотя NVIDIA уже анонсировала младшие Quadro на базе Pascal, в продаже они пока недоступны.
И причины такого подхода хорошо понятны. Переход с Maxwell на Pascal приносит с собой очень заметный прирост производительности, поэтому внедрение нового GPU в ускорителях среднего уровня моментально «обесценит» видеокарты, которые ещё совсем недавно было принято считать лучшими профессиональными ускорителями. С флагманами же проще — произошедший в P6000 и P5000 значительный прирост производительности лишь переводит Quadro M6000 и M5000 на более низкий уровень, но не делает их категорически устаревшими и бессмысленными.
Оценить, насколько более высоким потенциалом обладают новинки, можно из следующей таблицы, в которой мы сопоставили их характеристики с характеристиками предшественниц.
Итак, самая быстрая на данный момент видеокарта для графических рабочих станций — это Quadro P6000. Она основывается на процессоре GP102 — самом мощном варианте Pascal из числа чипов, ориентированных на работу с GDDR5X-памятью. Именно этот GPU, а не «суперкомпьютерный» GP100, следует считать прямым потомком процессора GM200, использовавшегося в основе Quadro M6000. Поэтому нет ничего удивительного, что по сравнению с прошлым флагманским профессиональным ускорителем видеокарта Quadro P6000 существенно нарастила свою вычислительную мощность: количество CUDA-ядер выросло на четверть.
Такое усиление сделало из Quadro P6000 самую быстродействующую видеокарту не только по меркам профессиональных решений. Впервые решение из линейки Quadro оказалось даже мощнее TITAN X. В P6000 процессор GP102 используется «на полную», и в нём активированы все заложенные в архитектуре 30 потоковых мультипроцессоров. TITAN X же, напомним, имеет лишь 28 активных мультипроцессоров, и по этой причине он несколько слабее профессионального флагмана.
Выигрышно смотрится Quadro P6000 и по объёму памяти. Видеокарта оборудована 24 Гбайт GDDR5X SDRAM, работающей при достаточно консервативной эффективной частоте 9 мегатрансферов в секунду, что при условии 384-битной шины даёт суммарную пропускную способность на уровне 432 Гбайт/с. По сравнению с обновлённой версией Quadro M6000 объём памяти остался тем же, зато её скорость за счёт использования GDDR5X заметно выросла. Причём 24-гигабайтная версия M6000 появилась на рынке сравнительно недавно, и число владельцев такой карты не столь высоко. Более же массовая вариация этой карты довольствовалась 12 Гбайт памяти, поэтому большинство владельцев мощных рабочих станций при переходе на Quadro P6000 получат не только прирост показателей производительности, но и увеличенную память, которая может быть полезна при работе с масштабными цифровыми проектами машин и механизмов. Как и раньше, память в Quadro P6000 поддерживает ECC, причём, поскольку сами чипы GDDR5X коррекцию ошибок не поддерживают, это — программная и активируемая на уровне драйвера функция.
Примечательно, что беспрецедентное быстродействие нового профессионального флагмана сочетается с достаточно умеренными энергетическими аппетитами. Паспортное значение теплового пакета Quadro P6000 установлено в традиционные для карт такого уровня 250 Вт, а система охлаждения, включающая закрытый металлическим кожухом радиатор и центробежный вентилятор, полностью позаимствована с M6000. Более того, P6000 удаётся обходится единственным 8-контактным разъёмом питания. Это несколько расходится со спецификациями (формально 8-контактный разъём рассчитан на 150 Вт мощности, а через слот PCIe x16 может подводиться до 75 Вт), но при реальном использовании проблем видеокарты в деле не наблюдается. Зато достигается полная обратная совместимость: в рабочей станции, где использовалась Quadro M6000, заменить её на новую P6000 не составит никакого труда.
Поскольку NVIDIA заявляет о том, что расчётная производительность Quadro P6000 на операциях 32-битной разрядности превышает 12 Тфлопс, можно сделать заключение о том, что новый флагман на 80 процентов производительнее предшественницы в вычислительном плане, в то время как превосходство в скорости растеризации составляет лишь порядка 48 процентов. Преимущество Quadro P6000 над TITAN X тоже впечатляет: игровой флагман имеет пиковую FP32-производительность лишь на уровне 11 Тфлопс.
Правда, столь радужные показатели пикового теоретического быстродействия несколько омрачает ситуация со скоростью исполнения 16- и 64-битных операций. В каждом шейдерном мультипроцессоре чипа GP102 на 128 CUDA-ядер для FP32-операций приходится лишь 4 ядра для FP64. И это значит, что производительность Quadro P6000 при работе с числами двойной точности соотносится со скоростью операций одинарной точности как 1:32. Здесь по сравнению с Quadro M6000 никаких изменений не произошло, а значит, самой быстрой видеокартой серии Quadro для 64-битных вычислений остаётся старушка Quadro K6000. Нет в Quadro P6000 и ускорения операций половинной точности FP16. Лишь одно из CUDA-ядер каждого шейдерного мультипроцессора аппаратно поддерживает такие операции, поэтому чип GP102 исполняет их в 64 раза медленнее, чем FP32-инструкции. И это значит, что для сложных физических расчётов карты серии Quadro подходят плохо, это — именно графический ускоритель, в котором поддержка FP16 и FP64 введена лишь для совместимости. Впрочем, не стоит забывать о специализированных ускорителях Tesla P100: именно они, а не Quadro, позиционируются NVIDIA как актуальные решения для суперкомпьютерных применений, и вот у них уже со скоростью FP16- и FP64-операций всё в порядке.
Вместе с флагманом Quadro P6000 компания выпустила и второй профессиональный графический ускоритель попроще — Quadro P5000. И в то время как P6000 — это самая быстрая на сегодняшний день видеокарта, P5000 выступает более массовой и дешёвой её альтернативой. Актуальная стоимость P6000 составляет около $5400, P5000 же, располагающую той же современной архитектурой Pascal, можно приобрести более чем вдвое дешевле — за сумму порядка $2500. Однако столь радикальное отличие в цене возникло не на пустом месте. В то время как Quadro P6000 — это флагманская видеокарта на базе полностью разблокированного чипа GP102, превосходящая TITAN X, P5000 — всего лишь профессиональный аналог GeForce GTX 1080, основанный на более простом GPU GP104.
В Quadro P5000 используется полная версия графического процессора GP104, а значит, эта видеокарта может предложить в распоряжение пользователя 20 шейдерных мультипроцессоров или 2560 CUDA-ядер — на четверть больше, чем было у Quadro M5000. Однако основной козырь данной профессиональной видеокарты не в экстенсивном наращивании числа CUDA-ядер. Так же, как и в случае с другими продуктами поколения Pascal, переход при производстве GPU на 16-нм техпроцесс позволил NVIDIA кардинально нарастить тактовые частоты. И в результате по пиковой вычислительной мощности Quadro P5000 обходит прошлую карту этого же класса, M5000, более чем в два раза, а превосходство новинки в скорости растеризации достигает 67 процентов. Прогресс более чем впечатляющий — до сих пор такого роста скоростных показателей всего за одну итерацию развития архитектуры в сфере графических ускорителей для рабочих станций мы ещё не встречали.
Заметно улучшилась в Quadro P5000 и подсистема видеопамяти. Её объём возрос до 16 Гбайт, а частота была доведена до тех же, что и у P6000, 9 мегатрансферов в секунду. Естественно, это потребовало перехода на GDDR5X, однако при этом используется лишь 256-битная шина. В результате, прирост в пропускной способности памяти по сравнению с M5000 получился не таким впечатляющим — всего лишь на уровне 36 процентов. Тем не менее, переход с M5000 на P5000 наверняка впечатлит профессионалов, работающих с CAD/CAM-системами: суммарные улучшения в производительности отрицать невозможно.
Правда, попутно выросло и энергопотребление. Для Quadro P5000 теперь установлен 180-ваттный тепловой пакет, и для подключения дополнительного питания используется один 8-контактный разъём. По габаритам и конструкции системы охлаждения Quadro P5000 похожа на P6000, но её кожух выполнен не из металла, а из пластика и лишён прозрачного окошка, открывающего вид на рёбра радиатора.
Помимо серьёзного прироста в производительности, привнесённого переводом профессиональных карт на архитектуру Pascal, новые видеокарты Quadro P6000 и P5000 могут похвастать и набором новых функциональных возможностей.
Одно из самых важных нововведений — это появление в картах семейства Pascal нового дисплейного контроллера. И хотя на первый взгляд новые Quadro P6000 и P5000, как и раньше, несут на себе порт DVI и по четыре выхода DisplayPort, теперь эти выходы соответствуют стандарту DisplayPort 1.4, который совместим с более высокими разрешениями и частотами кадровой развёртки. В результате в то время, как к профессиональным картам прошлого поколения можно было подключить до четырёх 4K-мониторов с частотой кадров 60 Гц, Quadro P6000 и P5000 могут работать с четырьмя 60-герцовыми 5K-мониторами (5120 × 2880), с четырьмя 120-герцовыми 4K-мониторами или даже с перспективными 8K-мониторами (7680 × 4320), например, с недавно анонсированным Dell UP3218K.
Кроме того, развивая возможности по обслуживанию мультимониторных конфигураций, для Quadro P6000 и P5000 компания NVIDIA предложила новую плату Quadro Sync, необходимую для синхронизации изображений, выводимых несколькими установленными в одной системе профессиональными видеокартами. Новая плата Quadro Sync II может работать с вдвое большим числом видеокарт поколения Pascal — их число теперь может доходить до восьми. И если принять во внимание возможность подключения к каждой видеокарте до четырёх мониторов, то получится, что современные технологии NVIDIA позволяют суммарно подсоединить к одной системе до 32 синхронизированных мониторов, которые могут быть объединены в единое рабочее пространство при помощи программного обеспечения NVIDIA Mosaic.
NVIDIA Quadro Sync II
Перекочевала в профессиональные карты семейства Pascal и технология Simultaneous Multi-Projection (SMP), которая позиционируется как шаг навстречу виртуальной реальности. Она позволяет за один проход рассчитывать геометрию сразу нескольких проекций сцены из разных точек. Основное применение этой возможности в случае игровых карт относится к поддержке VR-очков. Но в продуктах серии Quadro появление поддержки SMP может сделать их весьма удобным инструментом и для обслуживания комнат виртуальной реальности (CAVE).
В итоге, получилось так, что новые Quadro P6000 и P5000 ушли далеко вперёд по сравнению со своими предшественниками. Обе новинки выглядят не как простое плановое обновление линейки, они серьёзно повышают планку производительности и возможностей карт серии Quadro и, фактически, могут считаться революционным прорывом. По всем теоретическим показателям кроме объёма памяти P5000 выглядит даже лучше, чем M6000, а это значит, что профессиональным пользователям высокопроизводительных рабочих станций самое время задуматься о модернизации. И ещё больше аргументов в её пользу мы представим в тестировании, речь о котором пойдёт дальше.
Как мы тестировали
Тестирование профессиональных видеокарт мы выполняли, используя в качестве платформы рабочую станцию, основанную на восьмиядерном процессоре Intel Core i7–6900K с архитектурой Broadwell-E, работающем на частотах 3,2–3,7 ГГц. Также, в составе тестовой платформы использовалась материнская плата на чипсете Intel X99 и 32 Гбайт скоростной четырёхканальной памяти стандарта DDR4–2666 SDRAM. Вместе с профессиональными видеокартами, относящимися к поколению Pascal, в сравнении приняли участие флагманские карты предыдущего поколения, а кроме того, в некоторых тестах помимо видеоускорителей семейства Quadro участие приняла и игровая видеокарта GeForce GTX 1080.
Таким образом, для тестов было задействовано следующее оборудование:
Процессор: Intel Core i7–6900K (Broadwell-E, 8 ядер + HT, 3,2–3,7 ГГц, 20 Мбайт L3).
Процессорный кулер: Noctua NH-D15.
Материнская плата: ASUS X99-Deluxe (LGA2011-v3, Intel X99).
Память: 4 × 8 Гбайт DDR4–2666 SDRAM, 15–15–15–35 (2 x Patriot Viper 4 PV416G300C6K).
Видеокарты:
NVIDIA Quadro P6000;
NVIDIA Quadro P5000;
NVIDIA Quadro M6000 24 Гбайт;
NVIDIA Quadro M5000;
NVIDIA GeForce GTX 1080.
Дисковая подсистема: Kingston HyperX Savage 480 GB (SHSS37A/480G).
Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).
Тестирование проводилось в операционных системах Windows 7 Professional SP1×64 и Microsoft Windows 10 Enterprise Build 10240.
Использовавшиеся версии драйверов:
Intel Chipset Driver 10.1.2.80;
Intel Management Engine Interface Driver 11.0.0.1172;
Intel Turbo Boost Max Driver Version 1.0.1.9;
NVIDIA Quadro Driver Release 376.62.
Тестирование видеокарт происходило в разрешении 3840 × 2160 с отключенным параметром Vsync. Выбор 4K-разрешения обусловлен тем, что в FullHD-разрешении флагманские профессиональные видеокарты не могут раскрыть свой потенциал: производительность в этом случае ограничивается мощностью процессора, и результаты более быстродействующих решений не отличаются от показателей более слабых видеокарт. Кроме того, 4K-мониторы стали негласным стандартом для высокопроизводительных рабочих станций, на которые и нацеливаются предложения класса Quadro P6000 и P5000.
Для тестирования производительности в CAD/CAM-пакетах Autodesk 3ds max, Autodesk Maya, Dassault Systèmes SolidWorks и в PTC Creo использовались тесты, специально разработанные корпорацией Standard Performance Evaluation Corporation (SPEC). Для оценки скорости работы в Autodesk AutoCAD использовался тест Cadalyst Systems Benchmark. Скорость рендеринга оценивалась с помощью доступных в сети тестов и проектов, а кроме того, для оценки 3D-производительности мы применяли также и популярные бенчмарки компании Futuremark.
Производительность в CAD/CAM-пакетах
SPECviewperf 12.1
При тестировании профессиональных видеоускорителей первым делом мы всегда обращаемся к синтетическому тесту SPECviewperf, который за время своего существования занял место индустриального стандарта при первичной оценке производительности высокопроизводительных рабочих графических станций. Моделируя типовую нагрузку, этот тест показывает «чистую геометрическую» производительность ускорителей при работе через OpenGL и DirectX, которая определяется как аппаратными особенностями, так и качеством оптимизации драйверов. Принцип работы этого теста заключается в передаче графическому драйверу заранее сформированных трасс — последовательностей команд, задающих визуализацию сложных моделей, характерных для тех или иных профессиональных приложений.
Встроенные в SPECviewperf используемой нами двенадцатой версии скрипты воссоздают деятельность пользователя в окнах проекции в следующих профессиональных приложениях (в скобках приводятся названия соответствующих тестов): 3ds max 2016 (3dsmax-05), CATIA V6 R2012 (catia-04), Creo 2 (creo-01), Energy — абстрактный программный пакет для геологоразведки месторождений нефти и газа (energy-01), Maya 2013 (maya-04), Medical — проприетарное программное обеспечение для объёмного рендеринга изображений, формируемыми KT и МРТ сканерами (medical-01), Showcase 2013 (showcase-01), Siemens NX 8.0 (snx-02), Solidworks 2013 SP1 (sw-03). Результатом тестов выступает частота кадров при работе с теми или иными моделями. Тест выполнялся в разрешении 3840 × 2160.
Результаты, которые выдают новые профессиональные видеокарты поколения Pascal в SPECviewperf, хорошо иллюстрируют тот значительный рывок в производительности, который произошёл в новинках по сравнению с Quadro семейства Maxwell 2. Раньше при очередной смене поколений новая видеокарта субфлагманского позиционирования всегда выдавала скорость на уровне флагмана прошлого поколения, но сегодня картина совершенно иная. Действительно, Quadro M6000 оказывается повержена не только новым флагманом P6000, но и гораздо более дешёвой новинкой Quadro P5000. Таким образом, обладатели топовой профессиональной видеокарты поколения Maxwell 2 могут перейти на P5000 и при этом получить примерно 20-процентный прирост производительности.
Что же касается Quadro P6000, то от неё мы можем получить такой уровень быстродействия, который ранее можно было получить лишь в системах, использующих как минимум пару высокопроизводительных видеоакселераторов. Шутка ли, но в некоторых тестах, преимущество P6000 над M6000 может доходить до 80 процентов. В среднем же Quadro P6000 оказывается мощнее предшественницы где-то в полтора раза. Что вполне объяснимо изменившемся подходом NVIDIA к проектированию флагманских профессиональных видеоускорителей. Ведь сегодня старшая видеокарта Quadro — это самая быстрая видеокарта вообще, которая базируется на самой полновесной версии старшего графического процессора GP102 и имеет более высокую мощность даже по сравнению с TITAN X.
Впрочем, в полной мере при выборе графического ускорителя опираться на результаты SPECviewperf не стоит. Всё-таки этот бенчмарк имеет синтетическую природу, не учитывает нюансов конкретных приложений и почти не задействует сложные шейдерные эффекты, которые постепенно начинают использоваться для визуализации в том числе и профессиональными пакетами. Поэтому большое внимание мы уделили исследованию производительности в реальных приложениях для трёхмерного моделирования и автоматизированного проектирования.
Autodesk 3ds Max 2015
Тестирование в одном из популярнейших пакетов трёхмерного моделирования мы выполняли при помощи теста SPEC, который объединяет в себе 48 различных подтестов, направленных на комплексные измерения скорости моделирования, интерактивной графики и визуальных эффектов. Используемая нами версия этого бенчмарка работает с 3ds max 2015 SP4. Это –достаточно свежая версия пакета, а значит, в тесте задействуются новые шейдеры DirectX 11, векторные карты, новый движок визуализации окон проекции Nitrous и многие другие современные динамические и визуальные эффекты. Тесты проводились в разрешении 3840 × 2160 без сглаживания и со сглаживанием 8x.
Мы отказались от тестирования флагманских профессиональных видеокарт в FullHD-разрешении, потому что в нём четвёрка испытуемых ускорителей выдаёт практически одинаковые результаты. Зато в 4K-режиме, который уже стал для профессиональных инженеров, фактически, отраслевым стандартом, выгода от применения более новых и более мощных ускорителей видна очень хорошо. Здесь мы вновь можем наблюдать подавляющее преимущество архитектуры Pascal, которое делает Quadro P5000 более быстрой картой даже по сравнению с Quadro M6000. Что же касается Quadro P6000, то в особенно тяжёлых графических режимах с полноэкранным сглаживанием она способна обеспечить 40-процентное превосходство по сравнению с M6000 в скорости работы в окнах проекции.
Более подробные данные о скорости работы новинок при различных аспектах нагрузки можно получить на следующих диаграммах.
Autodesk AutoCAD 2016
Ещё одно популярное приложение для трёхмерного проектирования, работающее через интерфейс DirectX — это AutoCAD. Нагрузка на ускорители, создаваемая этим пакетом, не слишком велика, и с работой в нём прекрасно справляются даже игровые графические карты, но, тем не менее, разница в производительности решений разного уровня вполне заметна и особенно отчётливо проявляется в 4K-разрешении. Для проверки производительности в AutoCAD мы использовали тест Cadalyst Systems Benchmark.
Впрочем, говорить о острой необходимости выбирать для AutoCAD высокопроизводительные профессиональные ускорители мы бы всё же не стали. Как видно по графику, разница в интегральной производительности флагманских профессиональных карт разных поколений не выходит за пределы 10 процентов. А в прошлых тестированиях мы видели, что сравнимый уровень быстродействия вполне способны обеспечить и видеокарты среднего уровня, например, Quadro M4000. Иными словами, AutoCAD скорее стоит отнести к числу приложений, которые не могут раскрыть потенциал, заложенный в профессиональные ускорители поколения Pascal.
И даже больше того, если проанализировать производительность при различных режимах отображения 3D-моделей, то выяснится, что хоть какие-то отличия в скорости работы новых и старых Quadro есть только в каркасном и реалистичном режимах. Включение же визуальных стилей Hidden или Conceptual приводит к тому, что быстродействие ограничивается процессором, и любая из участвующих в тесте видеокарт обеспечивает идентичную скорость вращения и модификации тестовых моделей.
Что же касается режимов Wireframe и Realistic, то в них дело обстоит следующим образом.
Наиболее ресурсоёмким оказывается каркасный режим, и в нём Quadro P6000 и P5000 обеспечивают заметный прирост в скорости по сравнению с предшественницами семейства Maxwell. В целом же, несмотря на то, что карты Quadro одного класса, но разных поколений, обладают одинаковым количеством блоков растеризации и текстурирования, мы вновь наблюдаем подавляющее преимущество новинок, которое в данном случае обуславливается их высокими рабочими частотами.
PTC Creo Parametric 3.0
Система автоматизированного проектирования Creo — очень популярный инженерный инструмент, являющийся наследником пакета Pro/Engineer. Используемый нами бенчмарк разработки SPEC оперирует несколькими различными моделями, которые раскрывают разные аспекты производительности пакета Creo, в том числе и новые возможности, введённые в третьей версии этого программного обеспечения. Например, тест активирует порядко-независимую модель прозрачности поверхностей (Order Independent Transparency), методику SSAO (преграждение окружающего света в экранном пространстве), усовершенствованные материалы и рельефное текстурирование. Тесты проводились в разрешении 3840 × 2160.
Несмотря на то, что производительность была измерена в 4K-разрешении, Quadro P6000 и P5000 предлагают не слишком весомую прибавку в скорости по сравнению с картами Quadro предыдущего поколения. Очевидно, что быстродействие современных флагманских графических карт для инженерного применения возросло столь существенно, что во многих случаях оно стало даже избыточным, и поэтому прирост производительности от внедрения архитектуры Pascal не всегда оказывается заметен на практике. Впрочем, отрицать тот факт, что новый субфлагман Quadro P5000 явно быстрее видеокарты Quadro M6000 даже в таких, не самых благоприятных случаях, невозможно.
И кроме того, не стоит забывать, что различные режимы отображения моделей в окнах проекции создают разнородную нагрузку, и в каких-то случаях более мощные профессиональные ускорители могут сыграть куда более значимую роль, чем показано на диаграмме с интегральным результатом теста. Для того, чтобы убедиться в этом, давайте посмотрим на производительность новинок в Creo Parametric 3.0 более подробно.
Сильнее всего преимущество видеокарт нового поколения проявляется при включении сложных реалистичных визуальных эффектов: затенения и отражений. Также определённую нагрузку создаёт и удаление невидимых линий. В этих случаях старшие карты линейки Quadro последнего поколения предложат наилучший уровень быстродействия.
Autodesk Maya 2016
Популярный редактор трёхмерной графики Maya 2016 — это хороший пример профессионального приложения, использующего интерфейс OpenGL. Причём, графический движок Viewport 2.0 в последней версии Maya наконец-то переведён на современную версию OpenGL 4.x, в то время как в старых версиях использовался OpenGL 2.x. Именно поэтому для Maya стало важным использовать современные профессиональные видеокарты, драйверы которых полноценно поддерживают этот API. Для тестирования производительности мы воспользовались бенчмарком разработки SPEC, который был адаптирован к современной версии Maya и 4K-разрешению.
Относительная производительность карт Quadro разных поколений различается не слишком сильно, но новый субфлагман P5000 предлагает лучшую по сравнению с M6000 производительность и здесь.
Если же заняться анализом результатов более подробно, то можно получить следующую картину.
Относительная скорость протестированных видеокарт выглядит одинаково при любых режимах отображения. Две новые версии Quadro заметно увеличили производительность по сравнению с предшественницами, и новая 2500-долларовая P5000 оказалась более быстрым акселератором по сравнению с M6000, который всё ещё продаётся в магазинах по цене выше $3000.
Solidworks 2015
SolidWorks — это распространённый программный комплекс САПР для автоматизации работ промышленного предприятия на этапах конструкторской и технологической подготовки производства. Используемый нами бенчмарк SPEC для этого пакета использует объёмные модели со сложностью до 4,75 миллионов треугольников и использует три новых эффекта отображения RealView, Ambient Occlusion и Shadows в сочетании с базовыми стилями: с затенением и с затенением с видимыми кромками. Кроме того, в тесте используется порядко-независимая прозрачность и полноэкранное сглаживание. Тесты проводились в разрешении 3840 × 2160 с полноэкранным сглаживанием и без него.
В Solidworks 2015 преимущество новых видеокарт, построенных на архитектуре Pascal, проявляется серьёзнее, чем во многих других случаях. Очевидно, что поддержка в этой САПР сложных визуальных стилей требует соответствующей поддержки со стороны аппаратного обеспечения. И новые видеокарты Quadro P6000 и P5000 с лёгкостью её могут предоставить. Даже если ориентироваться на режим без полноэкранного сглаживания, то преимущество профессиональных видеокарт семейства Pascal над «одноклассниками» семейства Maxwell 2 доходит до 10-процентного уровня.
Однако в сложных режимах отображения 3D-моделей разница может быть гораздо сильнее, например, очень серьёзную нагрузку создаёт включение модели затенения Ambient Occlusion (AO).
Получается, что если вы хотите построить для себя наиболее комфортную среду проектирования в SolidWorks, то современный профессиональный ускоритель — одна из важнейших составляющих рабочей станции. Причём, по двум последним графикам отлично понятно, что вложения в этот компонент системы окупают себя на все сто процентов.
Производительность в Adobe Premiere Pro CC 2017
Adobe Premiere Pro — это не инженерное приложение для трёхмерного моделирования и проектирования, а система для нелинейного видеомонтажа. Тем не менее, мы решили включить её в наши тесты, потому что использование профессиональных видеокарт, способных ускорять видеообработку при помощи шейдерных процессоров, позволяет получить в ней заметный прирост быстродействия. Для оценки потенциала ускорителей при обработке видео силами CUDA-ядер мы измерили время финального рендеринга через Mercury Playback Engine с GPU-ускорением, работающим с CUDA, двух тестовых задач.
Первый тест был проведён со стандартным проектом для оценки производительности в Adobe Premiere Pro, PPBM11. Использовалась задача рендеринга H.264-ролика в FullHD-разрешении. При анализе полученных результатов необходимо учесть, что данный тестовый проект отличается наложением на исходный видеоматериал большого числа ресурсоёмких эффектов, которые хорошо ускоряются GPU.
Для получения более полной картины результаты тестов в Adobe Premiere Pro СС 2017 карт серии Quadro мы дополнили сведениями о скорости рендеринга, проводимого исключительно силами центрального процессора, а также при использовании игровой видеокарты GeForce GTX 1080.
Совреме
Полный текст статьи читайте на F-Center