OpenBLAS 0.3.31

good-penguin.png

Для тех, кто ищет быструю библиотеку «BLAS» для подпрограмм базовой линейной алгебры, теперь доступна оптимизированная реализация OpenBLAS 0.3.31 с открытым исходным кодом.

В OpenBLAS 0.3.31 добавлены расширения BFloat16 для BGEMM и BGEMV (эти процедуры выполняют умножение матриц и умножение матриц на векторы), другие новые расширения BLAS, пороговое значение размера задачи для многопоточности с различными ядрами, улучшено автоматическое определение компилятора Fortran, а также внесен ряд исправлений в систему сборки CMake для различных платформ, от Windows до FreeBSD.

OpenBLAS 0.3.31, как и большинство их релизов, также содержит ряд новых оптимизаций производительности, специфичных для процессоров. Появились новые оптимизации производительности RISC-V для целевых платформ ZVL128B и ZVL256B, а также улучшено определение RISC-V RVV 1.0. Для ARM64 также были внесены улучшения в производительность многопоточности. Кроме того, теперь доступно автоматическое определение SoC Apple M на Linux, а также процессоров AmpereOne.

>>> Исходный код OpenBLAS на GitHub

>>> Источник новости: Phoronix

©  Linux.org.ru