Энтузиаст протестировал китайские процессоры Loongson 3A5000

Loongson 3A5000

Энтузиаст состоит в различных чатах в Telegram и как-то недавно наткнулся на канал по процессорам Loongson (там одни говорящие на китайском, но, к счастью, админ понимает английский), поэтому он попросил SSH-доступ и провёл различные тесты данного процессора.

Сперва рассмотрим характеристики процессора Loongson 3A5000 и его предыдущую модель Loongson 3A4000.

Характеристики процессоров Loongson 3A5000 и Loongson 3A4000:

Бали проведены следующие тесты:


  • 7zip встроенный бенчмарк
  • Dhrystone, Whetsone
  • Coremark
  • Scimark 2
  • Mp MFLOPS
  • Stream
  • Готовые результаты в SPEC 2006 (1 поток)

Переходим к результатам


Результаты

По результатам можно сделать вывод, что процессор примерно сравним с процессором Core i7 4700 HQ и немного не дотягивает до Core i7–2600, хотя обгоняет его по GFLops’ам.


Немного об архитектуре LoongArch

LoongArch является сильно переработанной архитектурой MIPS64, часть ненужных команд MIPS64 было удалено и добавлено большое число расширений (SIMD, шифрование, бинарная трансляция, виртуализация),
всего порядка 2000+ инструкций.


Loongson 3A5000 (LS3A5000)

bucykukog3pymjamybryx0qf8lc.jpeg

Loongson 3A5000 — процессор на основе 64 разрядной RISC сильно переработанной архитектуре MIPS64 (loongarch64), имеет 4 ядра, которые работают на частоте 2.5 ГГц.

Architecture:        loongarch64
Byte Order:          Little Endian
CPU(s):              4
On-line CPU(s) list: 0-3
Thread(s) per core:  1
Core(s) per socket:  4
Socket(s):           1
NUMA node(s):        1
Model name:          Loongson-3A5000
CPU max MHz:         2500.0000
CPU min MHz:         225.0000
BogoMIPS:            4992.00
L1d cache:           64K
L1i cache:           64K
L2 cache:            256K
L3 cache:            16384K
NUMA node0 CPU(s):   0-3

Особенности процессора Loongson 3A5000:


  • 64 битная архитектура loongarch64
  • 128 битные SIMD расширения Loongson SIMD EXtension (LSX)
  • 256 битные SIMD расширения Loongson Advanced SIMD EXtension (LASX)
  • Внеочередное исполнение
  • Предсказание ветвлений
  • Поддержка виртуализации (LVZ)
  • Поддержка бинарной трансляции (LBT) архитектур MIPS, ARM, x86
  • 4 АЛУ
  • 2 SIMD блока
  • Кеши
    • 64 КБ L1 кэш команд на ядро
    • 64 КБ L1 кэш данных на ядро
    • 256 КБ L2 кэш на ядро
    • 16 МБ L3 кэш


Разбираем результаты


Dhrystone

Dhrystone достаточно древний тест 80х годов, написан на C. Тестирует целочисленную арифметику и работу со строками. Результаты измеряются в Dhrystone/s и DMIPS. (DMIPS = Dhrystone/s делить на 1757).


Whetstone

Тестирует арифметику с плавающей/фиксированной запятой, математические функции, ветвления, вызовов функций, присваиваний, работы с числами с фиксированной запятой, ветвлений. Результаты измеряются в MMIPS.

Современный тест, который должен заменить Dhrystone и Whetstone. Написан на C. Считает различные массивы, матрицы, сортировка и т. д. Предназначался для запуска на всём: от микроконтроллеров до мощных процессоров.


MP MFLOPS

Выполняет операции с плавающей запятой на векторах.


7zip

Встроенный тест архиватора 7z.

Запускается так:

7z b
7-Zip (a) 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21
p7zip Version 16.02 (locale=zh_CN.UTF-8,Utf16=on,HugeFiles=on,64 bits,4 CPUs LE)

LE
CPU Freq: 64000000 - - - - - - - -

RAM size:   16165 MB,  # CPU hardware threads:   4
RAM usage:    882 MB,  # Benchmark threads:      4

                       Compressing  |                  Decompressing
Dict     Speed Usage    R/U Rating  |      Speed Usage    R/U Rating
         KiB/s     %   MIPS   MIPS  |      KiB/s     %   MIPS   MIPS

22:      11279   327   3352  10973  |     130124   396   2803  11102
23:      10681   325   3346  10883  |     127682   393   2810  11048
24:      11183   353   3406  12025  |     126626   395   2815  11116
25:      11099   360   3525  12673  |     124248   394   2805  11058
----------------------------------  | ------------------------------
Avr:             341   3407  11638  |              395   2808  11081
Tot:             368   3108  11360


STREAM

Тест производительности ОЗУ.

Function    Best Rate MB/s  Avg time     Min time     Max time
Copy:           16748.3     0.009969     0.009553     0.010576
Scale:          18735.0     0.009437     0.008540     0.010660
Add:            16333.2     0.015492     0.014694     0.016449
Triad:          17796.0     0.014789     0.013486     0.015294


Версия компилятора, ядра Linux

Ядро Linux:

Linux 4.19.167-rc5.lnd.1-loongson-3 #1 SMP Sat Apr 17 07:32:32 UTC 2021 loongarch64 loongarch64 loongarch64 GNU/Linux

Версия компилятора: gcc version 8.3.0 (Debian 8.3.0-6.lnd.vec.20).


Выводы

Loongson 3A5000 вышел достаточно неплохим процессором, который уже сейчас может применяться в различных десктопных решениях, а процессоры с низкими частотами могут применяться в ноутбуках (с TDP порядка 30 Вт.)
Очень хотелось бы попробовать в работе такие компьютеры, а учитывая то, что они поддерживают видеокарты от AMD, то можно запускать и игры с открытым исходным кодом. Будем надеяться, что такие процессоры получат широкое применение.

Другие результаты для сравнения:

image-loader.svgКартинка


Ссылки


© Habrahabr.ru