Выпуск Intel oneDNN версии 3.5

good-penguin.png

12 июня командой разработчиков Intel была выпущена библиотека oneDNN версии 3.5, которая теперь является частью UXL Foundation, обеспечивая дополнительную оптимизацию производительности для существующего и будущего оборудования Intel.

В выпуске oneDNN 3.5 улучшена производительность масштабируемых процессоров Xeon Sapphire Rapids 4-го поколения, а также улучшена производительность Xeon 6 благодаря недавно выпущенным процессорам SIerra Forest и предстоящим процессорам Granite Rapids. В выпуске oneDNN 3.5 также есть общие настройки для повышения производительности примитива групповой нормализации, повышения производительности примитива MATMUL, улучшения производительности различных подграфов с помощью Graph API и других настроек.

Также предусмотрена настройка графического процессора с улучшениями для будущего оборудования Xe2 в Lunar Lake и Battlemage. Кроме того, появилось больше оптимизаций для серии Intel Data Center GPU Max, улучшена производительность Intel Arc Graphics DG2/Alchemist и другие улучшения.

В эту библиотеку для создания программного обеспечения глубокого обучения и искусственного интеллекта также внесен ряд дополнений API:

  • поддержка среды выполнения OpenCL для API Graph
  • экспериментальный API микроядра для процессоров Intel
  • поддержка FP64 MATMUL для графических процессоров Intel

Для справки: oneDNN — программное обеспечение, которое ранее было известно как «Intel Math Kernel Library for Deep Neural Networks (Intel® MKL-DNN)» и «Deep Neural Network Library (DNNL)». Это кроссплатформенная библиотека глубокой нейронной сети oneAPI (oneDNN) с открытым исходным кодом, состоящая из базовых строительных блоков для приложений глубокого обучения. oneDNN является частью общего проекта oneAPI, открытого стандарта, принятого Intel для унифицированного интерфейса прикладного программирования (API), предназначенного для использования в различных архитектурах вычислительных ускорителей (сопроцессоров), включая графические процессоры, ускорители искусственного интеллекта и программируемые в полевых условиях вентильные матрицы.

>>> Детальные подробности и загрузка доступны на странице проекта в github

©  Linux.org.ru