Архитектура Intel Gen11 GPU и дискретная видеокарта от Intel
Дискретная видеокарта начального уровня Intel Graphics Xe, официальный анонс состоялся 20 марта на игровой конференции GDC 2019
Компания Intel опубликовала документацию на графические процессоры Gen11 с описанием, чем они будут отличаться от предыдущего поколения. Ожидается, что архитектура Intel Gen11 станет основой для будущей архитектуры дискретной видеокарты Xe, поэтому описанные здесь технологии можно рассматривать как предварительный просмотр по крайней мере некоторых функций, которые реализуют в этих видеокартах. Пока что о будущих видеокартах Intel ничего не рассказывала, только показала несколько фотографий (или рендеров).
Архитектура процессора Intel Core, системы на кристалле (SoC) и кольцевой системы внутренних соединений (Ring Interconnect)
Исторически сложилось так, что графические процессоры Intel среднего уровня GT2 для настольных компьютеров и некоторые мобильные чипы уступали по производительности чипам от AMD. В таких сравнениях Intel исторически получала преимущество за счёт более мощного процессора по сравнению c APU, производными от микроархитектуры AMD Bulldozer. Теперь ситуация изменилась. Ryzen обладает гораздо более эффективным процессорным ядром, а мобильные процессоры AMD Ryzen гораздо более конкурентоспособны с Intel. Поэтому последней необходимо что-то предпринимать, в том числе решать проблему с производительностью GPU.
Детальная блок-схема Gen11
По технической документации сложно судить о производительности Gen11. Но некоторые специалисты считают, что Intel сможет гораздо эффективнее конкурировать с AMD. По крайней мере эффективнее, чем когда-либо прежде.
В новой архитектуре Intel GT2 предусмотрено 64 блока исполнения команд (EU, execution unit) по сравнению с 24 блоками в процессорах класса Skylake. Это значительное расширение ресурсов на чипе должно улучшить общую производительность по сравнению с предыдущим поколением. В таблице ниже приведены сравнительные характеристики графических подсистем Gen9 и Gen11.
Ключевые метрики Gen9 и Gen11
Исходя из технических характеристик, производительность вычислений в Gen11 вырастет примерно в 2,67 раза, как и пропускная способность для текстур (texture sampling). Пропускная способность блоков растровых операций (ROP) удвоилась, как и количество тестов high-Z за такт.
Кэш L3 увеличился в четыре раза, а пропускная способность GPU на запись удвоилась до 64 байт на такт. Пропускная способность памяти при использовании DDR4 должна остаться такой же, но поддержка LPDDR4 теоретически допускает более высокие тактовые частоты.
Кэш последнего уровня используется совместно GPU и CPU, чтобы сократить трафик с перемещением данных. Блоки видеодекодера улучшены для уменьшения битрейта. Они позволяют осуществлять одновременное декодирование нескольких потоков 4K и 8K. Добавлена поддержка адаптивной синхронизации и улучшенное декодирование HD-видео.
Теперь у GPU общая локальная память, которая не блокирует доступ к кэшу L3 при чтении. Intel утверждает, что это снижает задержку и повышает эффективность «атомарных операций».
Иерархия памяти на уровне микросхемы SoC и её максимальная теоретическая пропускная способность
Intel утверждает, что значительно улучшила общую пропускную способность памяти в Gen11.
В документации описано две новых технологии, которые Intel реализовала в графическом ускорителе:
- грубое затенение пикселей (Coarse Pixel Shading, CPS);
- затенение по позиции (Position Only SHading, POSH).
Грубое затенение пикселей снижает нагрузку на GPU, уменьшая количество цветовых сэмплов, которые используются для рендеринга изображения. Скриншот иллюстрирует, что CPS практически не отражается на качестве рендеринга.
Кадр из игры Citadel 1 в разрешении 2560×1440 (слева pixel rate 1×1, а справа 2×2). Хотя грубое затенение пикселей уменьшает количество вызовов шейдеров, на дисплее с высокой плотностью пикселей практически нет заметной разницы. Для сравнения показано также масштабированное изображение без применения сглаживания, в разрешении 1280×720
Уменьшение количества вызовов пиксельного шейдера экономит энергию и повышает производительность, то есть частоту кадров, на 20–40%.
На этом изображении объекты в красных рамках идентифицируется как достаточно удалённые от камеры и имеющие небольшое значение для общего качества изображения, поэтому детализацию можно уменьшить без заметного влияния на качество изображения с последующим повышением фреймрейта
Конвейер POSH запускает позиционный шейдер параллельно с основным приложением, что обычно позволяет генерировать результат намного быстрее, сказано в документации. Это часть системы рендеринга по позиции тайлов (Position Only Tile-Based Rendering, PTBR).
В целом, Gen11 станет значительным обновлением для процессоров Intel. Первые два поколения AMD Ryzen Mobile конкурировали со слабой графикой Skylake. Третьему поколению Ryzen Mobile APU, когда бы оно ни вышло, придётся конкурировать с гораздо более мощным чипом Intel, пишет издание ExtremeTech.