Профессиональные видеокарты NVIDIA Quadro P4000 и P2000: обзор и тестирование
Введение
Совсем недавно мы опубликовали обзор Quadro P6000 и Quadro P5000 — флагманских представителей свежего семейства видеокарт NVIDIA для рабочих станций, которые были анонсированы в середине прошлого года. В нём говорилось о том, что NVIDIA обновляет линейки профессиональных видеоускорителей ступенчато, и выпуск основанных на архитектуре Pascal карт Quadro среднего уровня может состояться не слишком скоро. Однако реальность оказалась несколько иной, и в прошлом месяце линейка Quadro претерпела достаточно серьёзные изменения. NVIDIA решила одним махом обновить все свои профессиональные карты среднего и нижнего сегментов, и перевести их со старых архитектур Kepler и Maxwell на наиболее современную основу поколения Pascal. Кроме того, компания добавила в линейку продуктов не имеющий аналогов среди предшественников бескомпромиссный акселератор высокого уровня Quadro GP100, который, в отличие от всех остальных своих собратьев, получил сразу всё самое лучшее, что можно было собрать на современном технологическом этапе: чип GP100 «Big Pascal», HBM2-память и высокую производительность при работе с вещественными числами 64-битной разрядности.
Безусловно, такое событие не может быть обойдено нашим вниманием, и по мере возможностей мы будем знакомить наших читателей с тем, как видоизменилась линейка графических карт NVIDIA для рабочих станций после произошедших анонсов. Например сегодня, во втором материале, посвящённом видеокартам Quadro PXXXX, мы посмотрим на показатели производительности видеокарт с ценой в диапазоне от $500 до $1000 — именно такие предложения пользуются наибольшей популярностью среди пользователей инженерных пакетов для 3D-моделирования и автоматизированного проектирования. В этот ценовой интервал попадают две новинки: видеокарты Quadro P4000 и Quadro P2000. Ещё более дешёвые Quadro P1000, P600 и P400, как и Quadro GP100, пока останутся за кадром.
Подробнее о NVIDIA Quadro P4000 и P2000
Детально о том, какие новые возможности архитектура Pascal может принести в профессиональные ускорители, мы уже говорили. Это отнюдь не одно только увеличение производительности, ставшее возможным благодаря внедрению при производстве графических процессоров современного технологического процесса с 16-нм нормами, который в свою очередь позволил производителю нарастить частоты GPU и добавить некоторое количество дополнительных CUDA-ядер. Чипы Pascal дают новым Quadro и новые возможности. Так, теперь благодаря поддержке DisplayPort 1.4 они могут работать с 5K-мониторами (с частотой вертикальной синхронизации 60 Гц), а также обладают технологией Simultaneous Multi-Projection (SMP), полезной для построения сцен в виртуальной реальности.
Тем не менее, новые Quadro PXXXX чётко замещают собой предшественников из серий MXXXX и KXXXX, отправляя старые модели в категорию устаревших. За несколько последних лет NVIDIA смогла выработать сбалансированную матрицу продуктов, поэтому добавление каких-либо моделей с непривычным сочетанием цен, возможностей и TDP вряд ли имеет смысл. Иными словами, к Quadro P4000 и P2000 прежде всего стоит относиться к осовремененным альтернативам Quadro M4000 и M2000.
Старшая профессиональная карта для среднего сегмента, Quadro P4000, основывается на урезанном чипе GP104, который в полной версии применяется в более дорогой карте для рабочих станций, P5000. Из 20 потоковых мультипроцессоров, которыми располагает этот чип изначально, в P4000 активировано лишь 14. В результате, Quadro P4000 нельзя назвать профессиональным аналогом GeForce GTX 1070: игровая карта располагает большими вычислительными ресурсами. Однако для своих профессиональных ускорителей NVIDIA придерживается иных принципов формирования линейки, и Quadro P4000 — вполне уравновешенное по характеристикам предложение.
Дело в том, что сокращение вычислительных ресурсов внутри графического процессора позволило NVIDIA создать заметно более энергоэффективную карту: Quadro P4000 выполнена в однослотовом дизайне, а для подключения к ней дополнительного питания используется всего один шестиконтактный разъём. При этом кулер, который NVIDIA сделала для Quadro P4000, — это уникальное решение для рабочих станций. В игровых картах подобных однослотовых систем охлаждения с радиальным вентилятором и выхлопом горячего воздуха за пределы компьютера попросту не бывает.
Тем не менее, Quadro P4000 обладает достаточно высоким уровнем быстродействия. Значительный рост тактовой частоты по сравнению с M4000 вкупе с добавлением некоторого числа дополнительных CUDA-процессоров делает P4000 примерно вдвое более производительным профессиональным акселератором по сравнению с предшественником. И даже более того, при сопоставлении новой и предшествующей линеек Quadro оказывается, что по вычислительной производительности P4000 почти на четверть превосходит и M5000.
Столь существенный прогресс в быстродействии и поддержка технологии SMP позволяют NVIDIA классифицировать Quadro P4000 в качестве решения, подходящего для разработки в области виртуальной реальности. Однако нужно иметь в виду, что P4000 — это младшая карта из числа вариантов, годящихся для такой роли.
Несмотря на значительный по сравнению с M4000 рост скоростных характеристик, Quadro P4000 может похвастать весьма умеренными тепловыми характеристиками. Расчётное тепловыделение платы составляет всего лишь 105 Вт, и это на 15 Вт ниже расчётного тепловыделения Quadro M4000. Таким образом, с точки зрения удельной производительности на каждый затраченный ватт P4000 лучше своей предшественницы более чем в 2,3 раза. Именно поэтому модернизация рабочих станций с переходом от M4000 к новой P4000 может иметь немалый смысл.
Подобно Quadro M5000 и M4000, P4000 несёт на себе 8 Гбайт GDDR5 SDRAM. В флагманских профессиональных ускорителях NVIDIA взяла курс на увеличение объёмов памяти, однако эта тенденция обошла P4000 стороной. Ширина шины памяти осталась 256-битной, но благодаря росту рабочей частоты чипов пропускная способность GDDR5 SDRAM по сравнению с M4000 существенно увеличилась. ECC у профессиональных карт классом ниже P5000 не поддерживается.
Поскольку Quadro P4000 — видеокарта с однослотовым дизайном, на ней имеется лишь четыре выхода DisplayPort 1.4, к которым можно подключать как 4K-мониторы (4096×2160) с частотой вертикальной синхронизации 120 Гц, так и 60-герцовые 5K-мониторы (5120×2880). Одной картой поддерживается до четырёх таких мониторов одновременно. Однако с применением двух дополнительных плат Quadro Sync II из восьми Quadro P4000 можно собрать единый массив, который сможет выводить информацию на объединённую «стену», составленную из 32 мониторов.
Пришедшая на смену Quadro M2000 новинка с индексом P2000 — заметно более простое по сравнению с P4000 решение. Поэтому нет ничего удивительного в том, что эта карта не только имеет однослотовый дизайн, но и оснащена существенно более простой и короткой системой охлаждения, не закрывающей всю поверхность платы. Кроме того, P2000 не требует для своей работы подключения дополнительного питания: всю необходимую энергию она забирает из слота PCI Express.
Впрочем, в производительном кулере и мощном электропитании Quadro P2000 и не нуждается, ведь в её основе лежит чип GP106, а не GP104. В игровом сегменте такой процессор применяется в видеокартах класса GeForce GTX 1060, но в Quadro P2000 он ещё и дополнительно урезан. Из 1280 доступных CUDA-ядер в P2000 доступно только 1024. Тем не менее, по сравнению с предшественниками производительность Quadro P2000 смотрится всё равно весьма впечатляюще. Оставаясь в рамках того же самого 75-ваттного теплового пакета, новинка не только на 66 процентов быстрее Quadro M2000, но и на 15 процентов превосходит в вычислительной производительности M4000.
Возможности чипа GP106 в P2000 сокращены не только в части расчётных ресурсов. В профессиональной видеокарте NVIDIA отключила также один из шести каналов памяти, в результате чего ширина шины памяти снизилась до 160 бит, а объём поддерживаемой памяти принял крайне непривычную величину 5 Гбайт, что, впрочем, на 1 Гбайт больше, чем устанавливалось в M2000. К тому же, раньше видеокарты такого класса имели 128-битную шину, поэтому пропускная способность памяти в итоге заметно выросла.
Подобно P4000, ускоритель Quadro P2000 снабжается четырьмя портами DisplayPort 1.4, которые имеют ровно такие же свойства, как и у старшей карты.
Стоит отметить, что различия между новыми Quadro P2000 и P4000 не ограничиваются лишь производительностью, энергоэффективностью и объёмом памяти. Поддерживает SLI, совместима с модулем Quadro Sync II и оснащена стерео-разъёмом только более быстродействующая и дорогая Quadro P4000. Quadro P2000 же ничего из этого списка своим обладателям предложить не сможет и потому выступает заметно более простым графическим 3D-акселератором для систем автоматизированного проектирования и трёхмерного моделирования.
Стоимость Quadro P4000 прогнозируется на уровне $800, Quadro P2000 же, судя по имеющимся данным, будет стоить в районе $500. Поступление карт в продажу ожидается в ближайшее время.
Как мы тестировали
Тестирование профессиональных видеокарт мы выполняли, используя в качестве платформы рабочую станцию, основанную на восьмиядерном процессоре Intel Core i7–6900K с архитектурой Broadwell-E, разогнанном до частоты 4,0 ГГц. Также, в составе тестовой платформы использовалась материнская плата на чипсете Intel X99 и 32 Гбайт скоростной четырёхканальной памяти стандарта DDR4–2666 SDRAM. Вместе с профессиональными видеокартами, относящимися к поколению Pascal, в сравнении приняли участие флагманские карты предыдущего поколения.
Таким образом, для тестов было задействовано следующее оборудование:
Процессор: Intel Core i7–6900K на частоте 4,0 ГГц (Broadwell-E, 8 ядер + HT, 20 Мбайт L3).
Процессорный кулер: Noctua NH-D15.
Материнская плата: ASUS X99-Deluxe (LGA2011-v3, Intel X99).
Память: 4 × 8 Гбайт DDR4–2666 SDRAM, 15–15–15–35 (2 x Patriot Viper 4 PV416G300C6K).
Видеокарты:
NVIDIA Quadro P5000;
NVIDIA Quadro P4000;
NVIDIA Quadro P2000;
NVIDIA Quadro M5000;
NVIDIA Quadro M4000;
NVIDIA Quadro M2000.
Дисковая подсистема: Kingston HyperX Savage 480 GB (SHSS37A/480G).
Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).
Тестирование проводилось в операционных системах Windows 7 Professional SP1×64 и Microsoft Windows 10 Enterprise Build 10240.
Использовавшиеся версии драйверов:
Intel Chipset Driver 10.1.2.80;
Intel Management Engine Interface Driver 11.0.0.1172;
Intel Turbo Boost Max Driver Version 1.0.1.9;
NVIDIA Quadro Driver Release 376.84.
Тестирование видеокарт происходило в разрешениях 1920 × 1200 и 3840 × 2160 с отключенным параметром Vsync. Использование сразу двух вариантов разрешения обусловлено тем, что современные профессиональные ускорители среднего ценового диапазона широко применяются в рабочих станциях, работающих с различными мониторами. Хотя устойчивая тенденция к переходу к 4K-разрешениям вовсю прослеживается и в сфере профессиональной графики, многие инженеры пока продолжают пользоваться старыми FullHD-мониторами. Поэтому сегодняшнее тестирование было выполнено по расширенной схеме, с учётом интересов всех групп пользователей.
Для тестирования производительности в CAD/CAM-пакетах Autodesk 3ds max, Autodesk Maya, Dassault Systèmes SolidWorks и в PTC Creo использовались тесты, специально разработанные корпорацией Standard Performance Evaluation Corporation (SPEC). Для оценки скорости работы в Autodesk AutoCAD использовался тест Cadalyst Systems Benchmark. Кроме того, для прочих аспектов производительности применялись некоторые синтетические тесты: Futuremark 3DMark 2.3.3663, Luxmark 3.1 и Compubench CL 1.5 Desktop Edition.
Производительность в CAD/CAM-пакетах
SPECviewperf 12.1
При тестировании профессиональных видеоускорителей первым делом мы всегда обращаемся к синтетическому тесту SPECviewperf, который за время своего существования занял место индустриального стандарта при первичной оценке производительности высокопроизводительных рабочих графических станций. Моделируя типовую нагрузку, этот тест показывает «чистую геометрическую» производительность ускорителей при работе через OpenGL и DirectX, которая определяется как аппаратными особенностями, так и качеством оптимизации драйверов. Принцип работы этого теста заключается в передаче графическому драйверу заранее сформированных трасс — последовательностей команд, задающих визуализацию сложных моделей, характерных для тех или иных профессиональных приложений.
Встроенные в SPECviewperf используемой нами двенадцатой версии скрипты воссоздают деятельность пользователя в окнах проекции в следующих профессиональных приложениях (в скобках приводятся названия соответствующих тестов): 3ds max 2016 (3dsmax-05), CATIA V6 R2012 (catia-04), Creo 2 (creo-01), Energy — абстрактный программный пакет для геологоразведки месторождений нефти и газа (energy-01), Maya 2013 (maya-04), Medical — проприетарное программное обеспечение для объёмного рендеринга изображений, формируемыми KT и МРТ сканерами (medical-01), Showcase 2013 (showcase-01), Siemens NX 8.0 (snx-02), Solidworks 2013 SP1 (sw-03). Результатом тестов выступает частота кадров при работе с теми или иными моделями. Тест выполнялся в разрешениях 1920 × 1200 и 3840 × 2160.
Полусинтетический SPECviewperf очень убедительно сообщает о преимуществах архитектуры Pascal. Ещё когда мы тестировали флагманские профессиональные карты нового поколения, было очень хорошо заметно, что на этот раз NVIDIA совершила гораздо больший, чем обычно, шаг в сторону наращивания производительности. А в среднем сегменте это проявляется ещё очевиднее.
В частности, сравнительно недорогая Quadro P4000 не просто достаёт до уровня карты прошлого поколения, стоящей на ступеньку выше, как это происходило при смене семейств раньше. Она поднимается гораздо выше и обеспечивает очень заметное преимущество даже на фоне Quadro M5000. Аналогичным образом проявляет себя и Quadro P2000. Производительность этого ускорителя попадает в промежуток между M4000 и M5000. В итоге, произошедшее обновление линейки Quadro в какой-то мере можно назвать революционным. Дело в том, что благодаря внедрению архитектуры Pascal карт уровня P2000 и P4000 теперь может хватать для работы в системах автоматизированного проектирования и трёхмерного моделирования даже в 4K-разрешении.
Autodesk 3ds Max 2015
Тестирование в одном из популярнейших пакетов трёхмерного моделирования мы выполняли при помощи теста SPEC, который объединяет в себе 48 различных подтестов, направленных на комплексные измерения скорости моделирования, интерактивной графики и визуальных эффектов. Используемая нами версия этого бенчмарка работает с 3ds max 2015 SP4. Это — достаточно свежая версия пакета, а значит, в тесте задействуются новые шейдеры DirectX 11, векторные карты, новый движок визуализации окон проекции Nitrous и многие другие современные динамические и визуальные эффекты. Тесты проводились трижды: в разрешении 1920 × 1200 с использованием сглаживания 8x и без него, а также в разрешении 3840 × 2160 без сглаживания.
Результаты показательны. На диаграмме нетрудно усмотреть подтверждение тезиса о том, что Quadro P4000 обеспечивает производительность лучше, чем M5000, а Quadro P2000 легко обходит M4000. Но гораздо интереснее другое наблюдение: видеокарты уровня выше P4000 сегодня не имеет смысла использовать в системах, работающих в FullHD разрешении, по крайней мере в 3ds max. Например, Quadro P5000 в таком разрешении выдаёт практически аналогичную производительность, как и более дешёвые GPU. А это значит, что системы с флагманскими профессиональными видеокартами должны комплектоваться современными мониторами или же многодисплейными массивами системами, собранными по технологии NVIDIA Mosaic.
Более подробные данные о скорости работы новинок при различных аспектах нагрузки можно получить на следующих диаграммах.
Autodesk AutoCAD 2016
Ещё одно популярное приложение для трёхмерного проектирования, работающее через интерфейс DirectX — это AutoCAD. Нагрузка на ускорители, создаваемая этим пакетом, не слишком велика, и с работой в нём прекрасно справляются даже игровые графические карты, но, тем не менее, разница в производительности решений разного уровня вполне заметна и особенно отчётливо проявляется при повышении разрешения. Для проверки производительности в AutoCAD мы использовали тест Cadalyst Systems Benchmark, который был проведён как в стандартном разрешении 1920 × 1200, так и с 4K-монитором в разрешении 3840 × 2160.
Производительность профессиональных видеокарт в AutoCAD 2016 различается не столь сильно, особенно в FullHD-разрешении. Здесь гораздо большее значение имеет мощность центрального процессора, а для визуализации процесса проектирования вполне можно обойтись и видеокартой уровня Quadro P2000.
Однако это всё же не совсем так. Дело в том, что некоторые режимы отображения 3D-моделей всё-таки создают заметную графическую нагрузку. Например, наибольшими аппетитами выделяются каркасный и реалистичный режимы (Wireframe и Realistic). Именно ради них и имеет смысл отдавать предпочтение новым профессиональным видеокартам поколения Pascal, которые могут обеспечить более высокую плавность и точность отображения.
Впрочем, всё сказанное о производительности в AutoCAD относится в первую очередь к работе в 4K-разрешении. А для FullHD-мониторов видеокарты старше Quadro M4000 и P2000 совершенно избыточны.
PTC Creo Parametric 3.0
Система автоматизированного проектирования Creo — очень популярный инженерный инструмент, являющийся наследником пакета Pro/Engineer. Используемый нами бенчмарк разработки SPEC оперирует несколькими различными моделями, которые раскрывают разные аспекты производительности пакета Creo, в том числе и новые возможности, введённые в третьей версии этого программного обеспечения. Например, тест активирует порядко-независимую модель прозрачности поверхностей (Order Independent Transparency), методику SSAO (преграждение окружающего света в экранном пространстве), усовершенствованные материалы и рельефное текстурирование. Тесты проводились в двух разрешениях: 1920 × 1200 и 3840 × 2160.
И вновь знакомая картина. Если вы планируете пользоваться FullHD-монитором, то выбирать карты мощнее Quadro P2000 смысла нет. Зато в 4K-разрешении мощные ускорители проявляют себя очень достойно. P4000 оказывается на 15 процентов быстрее, чем M5000 и на 51 процент — чем M4000. Не ударяет в грязь лицом и P2000. Эта видеокарта на 66 процентов обгоняет M2000 и заметно опережает даже M4000, обеспечивая примерно 19-процентное превосходство над ней. Столь убедительные результаты, показанные профессиональными ускорителями поколения Pascal, во многом обусловлены технологической продвинутостью пакета PTC Creo. Его графический движок не стесняется прибегать к задействованию теней и отражений, по-разному визуализирует различные классы материалов, использует карты рельефа и поддерживает HDR-изображения. Иными словами, пакет Creo совместно с современными видеокартами семейства Pascal способен создавать действительно реалистичную рабочую среду, что даёт инженерам возможность получать полное представление о внешнем виде деталей в реальном мире.
Кроме того, не стоит забывать, что различные режимы отображения моделей в окнах проекции создают разнородную нагрузку, и в каких-то случаях более мощные профессиональные ускорители могут сыграть куда более значимую роль, чем показано на диаграмме с интегральным результатом теста. Для того, чтобы убедиться в этом, давайте посмотрим на производительность новинок в Creo Parametric 3.0 более подробно.
Сильнее всего преимущество видеокарт нового поколения проявляется при включении реалистичных визуальных эффектов: затенения и отражений. Также определённую нагрузку создаёт и удаление невидимых линий. В этих случаях старшие карты линейки Quadro последнего поколения предложат наилучший уровень быстродействия.
Autodesk Maya 2016
Популярный редактор трёхмерной графики Maya 2016 — это хороший пример профессионального приложения, использующего интерфейс OpenGL. Причём, графический движок Viewport 2.0 в последних версиях Maya наконец-то переведён на современную версию OpenGL 4.x, в то время как в старых версиях использовался OpenGL 2.x. Именно поэтому для Maya стало важным использовать современные профессиональные видеокарты, драйверы которых полноценно поддерживают этот API. Для тестирования производительности мы воспользовались бенчмарком разработки SPEC, который был адаптирован к современной версии Maya и 4K-разрешению.
Относительная усреднённая производительность карт Quadro разных поколений различается не слишком сильно, однако привычные соотношения результатов прослеживаются и тут. Quadro P4000 уверенно обходит субфлагмана прошлого поколения, а Quadro P2000 предлагает увеличение быстродействия не только по сравнению с M2000, но и с M4000.
Если же заняться анализом результатов более подробно, то можно получить следующую картину.
Обратите внимание, общая картина производительности в Maya сильно отличается от того, что наблюдалось в большинстве других пакетов. Здесь более мощные графические карты могут продемонстрировать свой потенциал не только в 4K-разрешениях. Даже при установке сравнительно невысокого по современным меркам разрешения 1920 × 1200 многие режимы окон проекции лучше работают на видеокартах с большим количеством CUDA-ядер. А это значит, что для Maya вопрос правильного подбора профессионального ускорителя может быть очень важен.
Solidworks 2015
SolidWorks — это распространённый программный комплекс САПР для автоматизации работ промышленного предприятия на этапах конструкторской и технологической подготовки производства. Используемый нами бенчмарк SPEC для этого пакета использует объёмные модели со сложностью до 4,75 миллионов треугольников и использует три новых эффекта отображения RealView, Ambient Occlusion и Shadows в сочетании с базовыми стилями: с затенением и с затенением с видимыми кромками. Кроме того, в тесте используется порядко-независимая прозрачность и полноэкранное сглаживание. Тесты проводились в разрешении 1920 × 1200 с полноэкранным сглаживанием и без него, и в разрешении 3840 × 2160 без сглаживания.
SolidWorks оказывается ещё одним инженерным приложением, чувствительным к производительности GPU. Если смотреть на результаты, полученные в 4K-разрешении, то Quadro P2000, например, способна предложить 30-процентное увеличение быстродействия по сравнению с Quadro M2000, а Quadro P4000 по сравнению с M4000 обеспечивает улучшение интегрального скоростного показателя на 27 процентов. Столь впечатляющий прогресс закономерен. Профессиональные карты поколения Pascal не только получили на 66 и 100 процентов более высокую вычислительную производительность по сравнению со своими предшественниками серии Maxwell, но и располагают более скоростной подсистемой памяти, пропускная способность которой на текущем витке развития возросла на 25–33 процента.
Всё перечисленные новые возможности могут быть весьма кстати именно в SolidWorks, так как эта САПР поддерживает сложные визуальные стили.
До недавних порт профессиональные инженеры предпочитали при работе в SolidWorks режим отображения Shaded with Edges. Для современных ускорителей он не представляет большой проблемы: и Quadro P2000, и Quadro P4000 могут обеспечить в нём максимальную производительность, ограниченную лишь мощностью центрального процессора, особенно если речь идёт о работе в FullHD-разрешении. Однако по-настоящему преимущество новинок проявляется совсем не в этом. Гораздо важнее, что новые видеокарты семейства Pascal, относящиеся к среднему классу, способны сделать комфортной работу и в более сложных и наглядных режимах отображения моделей в окнах проекции. Например, режим RealView добавляет реалистичные материалы и поддерживает отражения среды и тени, а Ambient Occlusion дополнительно улучшает реалистичность затенения и помогает лучше выделять формы деталей.
Включение RealView и Ambient Occlusion накладывает серьёзную нагрузку на GPU, поэтому в этом случае производительные ускорители действительно необходимы. Особенно хорошо это видно на последних диаграммах с результатами при активации Ambient Occlusion. Видеокарты поколения Pascal выступают здесь значительно убедительнее по сравнению с предшественницами. Quadro P2000 опережает не только M2000, но и M4000, а Quadro P4000 оказывается способной на соперничество с флагманами прошлого поколения.
Вычислительная производительность
Профессиональные графические карты могут использоваться и при финальном рендеринге. Многие алгоритмы рендеринга свободно переносятся на параллельные процессоры GPU, и за счёт этого получают возможность более эффективного исполнения. NVIDIA, например, даже развивает собственную технологию фотореалистичного рендеринга NVIDIA Iray. Но для целей тестирования мы пользуемся другим движком для построения фотореалистичных изображений методом трассировки лучей, использующим мощности графических карт через универсальный программный интерфейс OpenCL, — LuxRender. LuxRender имитирует распространение света в реальности при помощи специальных алгоритмов и существует в версиях для следующего специализированного ПО: Blender, 3dsmax, SketchUp, C4D, XSI, Poser и др.
Для измерения скорости работы LuxRender мы воспользовались тестовым приложением LuxMark 3.1 и двумя сценами: Newmann TLM-102 SE средней сложности и Hotel Lobby с высокой сложностью.
Особенностью профессиональных графических карт NVIDIA последних поколений, в том числе и Pascal, выступает их невысокая вычислительная производительность при работе с числами двойной точности. Фактически, производительность FP32- и FP64-операций для GPU класса Quadro PXXXX соотносится как 1:32, из-за чего, например, такие акселераторы плохо подходят для сложных научных расчётов (это не касается Quadro GP100). Однако для работы в системах трёхмерного моделирования и автоматизированного проектирования это не страшно — в них нужны лишь операции одинарной точности. Это же касается и финального рендеринга. В итоге, в тесте LuxMark новые карты Quadro демонстрируют существенно возросшую производительность по сравнению со своими предшественницами — в полном соответствии с увеличением теоретических показателей Тфлопс.
Другим тестом, на базе которого мы делали выводы о вычислительной производительности, стал кроссплатформенный CompuBench CL. Он способен оценить вычислительную скорость графических процессоров при разной нагрузке, например, при физической симуляции частиц или поверхности жидкости, либо при распознавании лиц.
Здесь вычисления с двойной точностью также не используются. И мы вновь видим, что новое поколение карт Quadro работает заметно быстрее старого.
Производительность в игровом 3D
По традиции тестирование производительности профессиональных видеокарт мы завершаем, приводя их результаты в игровом тесте Futuremark 3DMark. Как нередко отмечается, у профессиональных карт обычно существуют геймерские прообразы. Сегодня же ситуация такова, что, хотя Quadro P4000 и P2000 и основываются на чипах GP104 и GP106, прямых аналогов среди игровых видеокарт у них нет. А потому тестирование производительности в 3DMark Fire Strike Ultra и представляет особый интерес: оно позволяет понять, на каком уровне находится DirectX-производительность рассмотренных решений.
Результат Quadro P4000 заведомо ниже, чем у GeForce GTX 1070 и примерно соответствует показателям Radeon R9 Fury. В то же время Quadro P2000 заметно проигрывает GeForce GTX 1060 и приближается скорее к GeForce GTX 1050 Ti, что совершенно неудивительно, учитывая архитектурные особенности. Однако стоит иметь в виду, что применение игровых ускорителей в профессиональных задачах не позволит получить производительность уровня Quadro. Дело в том, что видеокарты, специально предназначенные для работы в системах автоматизированного проектирования и трёхмерного моделирования, имеют специальные оптимизации для обработки высокополигональных 3D-сцен со сложной геометрией, и это очень убедительно проявляется на практике.
Энергопотребление
Обновление профессиональных графических карт с внедрением архитектуры Pascal проведено таким образом, чтобы пользователи имели возможность заменить старые ускорители Quadro на новые без внесения каких-то изменений в систему питания или охлаждения. То есть, Quadro P4000 и P2000 номинально потребляют электроэнергии и выделяют тепла не более своих предшественников, а их габариты такие же, как у соответствующих карт поколения Maxwell.
Для того, чтобы проверить ситуацию с энергетическими и тепловыми характеристиками на практике, мы измерили фактический уровень энергопотребления полных систем (без монитора), оснащённых различными профессиональными видеокартами. Используемый нами в тестовой системе новый цифровой блок питания Corsair RM850i позволяет осуществлять мониторинг потребляемой и выдаваемой электрической мощности, чем мы и воспользовались для практических измерений. То есть, на следующем ниже графике приводится полное потребление систем, измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается. Нагрузка для определения пикового потребления создавалась тестом FurMark 1.18.2, запущенным в режиме «Burn» в окне с разрешением 1280×720. Такой вариант нагрузки хорош тем, что он, как и большинство профессиональных приложений, использует API OpenGL.
Новые карты чётко вписываются в установленные рамки. Потребление Quadro P2000 при максимальной нагрузке почти не отличается от потребления Quadro M2000, а Quadro P4000 даже немного экономичнее, чем Quadro M4000. Что, собственно, полностью подтверждает заявленные спецификации, в которых говорится, что P2000 и M2000 схожи по потреблению, а P4000 экономичнее предшественницы на 15 Вт.
Отдельно стоит сказать и о том, что применённые на средних картах поколения Pascal системы охлаждения отлично справляются со своей работой несмотря на достаточно скромные габариты. Процессоры GP104 и GP106 выпускаются с применением современного техпроцесса с 16-нм нормами, поэтому нагреваются они совсем не сильно. Даже при предельной нагрузке температура чипа GPU у Quadro P4000 и P2000 не выходит за пределы 80–85 градусов, а максимальная скорость вращения вентиляторов в обоих случаях составляет порядка 2500 оборотов в минуту. И это значит, что новые видеокарты заведомо не смогут причинить своим пользователям никакого акустического дискомфорта.
Выводы
Итак, профессиональные графические карты на базе архитектуры Maxwell стали, наконец, вчерашним днём. У всех карт серии Quadro MXXXX теперь есть достойные последователи с более новой архитектурой Pascal. Причём, на этот раз NVIDIA удалось сделать очень серьёзный шаг вперёд, который перевёл решения на базе Maxwell в категорию устаревших продуктов не только по формальным признакам. Производительность новых Quadro PXXXX действительно впечатляет. Так, любая из двух рассмотренных нами в обзоре средних карт нового поколения, P4000 и P2000, не только опережает свою прямую предшественницу, но и обгоняет карту прошлого поколения уровнем выше. А это значит, что быстродействие, которое раньше было свойственно лишь наиболее дорогим высокопроизводительным рабочим станциям, сегодня доступно по гораздо более низкой стоимости — в среднем ценовом сегменте.
Впрочем, эти же тесты показали, что столь высокая производительность требуется далеко не всегда. Нагрузку, которая способна загрузить хотя бы карты уровня Quadro P4000 и P2000, создают далеко не все приложения, особенно если речь идёт о работе в FullHD, а не 4K-разрешениях. С другой стороны, инженерных пакетов, которые достойны видеоускорителей такого класса, не так уж и мало, и здесь в качестве примеров можно привести достаточно солидный список, включающий SolidWorks, Creo, Catia, Maya, 3ds max и проч. Многие средства проектирования и моделирования постепенно приходят к необходимости использования в окнах проекции улучшенных эффектов визуализации. Дополнительная реалистичность становится всё более востребована, так как она позволяет сделать работу инженера более комфортной и продуктивной. Ускорители класса Quadro P4000 и P2000 хорошо подходят для таких случаев: как мы видели, с ними включение затенений и отражений в окнах проекции не приводит к падению производительности до недопустимых уровней. И это значит, что для профессиональной работы в современных системах автоматизированного проектирования и трёхмерного моделирования они способны стать весьма достойным вариантом.
При этом стоит подчеркнуть, что если говорить о видеокартах именно для САПР, то во многих случаях предложения уровня Quadro P6000 и P5000 на сегодня являются избыточными. Об этом мы говорили в нашем прошлом обзоре, и можем повторить это снова. Quadro P4000 и P2000 же хороши тем, что при таких применениях они предлагают вполне адекватную скорость по сравнительно невысокой цене. И вполне вероятно, что благодаря данному сочетанию качеств именно эти видеокарты станут одним из самых популярных выборов среди профессиональных инженеров. Кроме того, Quadro P4000 выступает младшей профессиональной видеокартой NVIDIA, которая подходит для работ
Полный текст статьи читайте на F-Center