Серверы Huawei: функциональное тестирование

Данная статья подготовлена Андреем Сидоровым, инженером Unix Сервисного центра компании «Инфосистемы Джет».

Недавно у одного нашего заказчика было проведено тестирование оборудования Huawei, результатами которого мы бы и хотели с вами поделиться. Главной задачей тестирования являлась проверка основных функций оборудования Huawei и их совместимости с текущей инфраструктурой заказчика. На «растерзание» нам досталось достаточно большое количество железа ‒ стоечные серверы, блейд-корзины.

Серверы на тесты достались следующие:

  • RH1288 V3 ‒ 1 unit, 2 socket
  • RH2288 V3 ‒ 2 unit, 2 socket
  • RH5885 V3 ‒ 4 unit, 4 socket
  • RH8100 V3 ‒ 8 unit, 8 socket

Первые два из них работают с Intel Xeon E5-* V3 и DDR4, вторые два ‒ Xeon V2 и DDR3

Пройдемся по пунктам, как и что мы тестировали.


Первое и одно из самых главных ‒ это надежность.
Здесь мы выдергивали блоки питания, вентиляторы, диски ‒ на всех серверах, memory-board на 8100, полностью обрубали питание на каждом сервере. В итоге наших действий ни один сервер не пострадал, проверку надежности они прошли, но были найдены несколько особенностей.

Замена БП и вентиляторов происходит штатно, согласно документации. Немного огорчило, что на 1288 и 2288 замена вентиляторов ‒ только с выключением.

Замена дисков на любых серверах ‒ если организован железный RAID, то надо ставить утилиту от LSI на хост и только там смотреть процесс ребилда. Или же перезагрузиться и смотреть во встроенной утилите. Из management-интерфейса такая информация недоступна.
Для горячей замены memory-board на 8100 нужно включить hot-sparing для каждого ряда, тогда, при обнаружении некоего количества ошибок, memory-board переедет на hot-spare board. Механизм переезда может быть или автоматический, или в ручном режиме. Плюсы ‒ замена памяти без выключения сервера, минусы ‒ теряем 1/8 всей памяти в системе. Процесс переезда долгий, 256ГБ ‒ 5‒6 часов. Не спасает, если борда или планка памяти внезапно умрет, но для этого есть memory mirror. Плюсы: если все это настроить, единственное, что может подкосить вашу систему ‒ умерший процессор. Минусы: теряем 9 из 16 memory board.

Вторым пунктом нашей программы было тестирование management-интерфейса.
Проверили, какую информацию он выдает, по каким протоколам может ее отдать, по каким протоколам может управляться сам интерфейс. Их, собственно, было 3:

HMM ‒ интерфейс управления корзиной. Своеобразный. Можно настроить ММ лезвий, но нельзя через web-интерфейс настроить gateway для свитчей, через CLI ‒ можно. Умеет создавать профили для слотов с заранее прописанными MAC и WWN, но с HMM перейти на web-интерфейс лезвия нельзя.

iMANA 200 ‒ интерфейс управления серверами и лезвиями поколения V2 и некоторыми моделями V3
iBMC ‒ интерфейс управления серверами и лезвиями поколения V3.

Обладают схожим функционалом, но сильно отличаются по дизайну. Джентельменский набор ‒ можно посмотреть статусы компонент, могут эти статусы прислать по почте или SNMP (не могут syslog). К сожалению, нельзя посмотреть общий объем памяти в системе, только перемножив количество планок на их емкость ‒ такая информация есть. KVM присутствует, и он совершенно обычен. Есть информация о текущей загрузке вентиляторов и БП. Плохо дружат с LDAP ‒ не поддерживаются пробелы в именах групп и OU, вложенные OU. Сервер контроллера домена требуется задавать как IP.

Доступные протоколы для управления ‒ http (редиректит на https), https, ssh, telnet (по умолчанию выключен). Есть SNMP, V3 включен по умолчанию, выключить нельзя. Всю информацию, которую предоставляют, можно получить через IPMI, SNMP. Для обновления прошивок через CLI есть ftp, выключенный по умолчанию.

Третий пункт — обновление прошивок.
С сайта производителя доступны обновления только для ММ, BIOS. Прошивок для RAID-контроллеров или HBA нет. Все прошивки приходится устанавливать по одной, какого-либо загрузочного образа для единомоментного обновления всех прошивок Huawei пока не сделал. Update iBMC, iMANA, HMM безболезненны для ОС.Четвертым пунктом шла установка различных ОС.
Ставили VMware ESXi 5.5, RHEL 7.1, Win 2008R2 SP1, Win 2012 R2. Проблем с установкой не возникало, драйверы доступны на сайте Huawei. ОС можно ставить либо как обычно, либо с Huawei Service CD. В последнем случае ОС ставится со всеми драйверами сразу.

Вывод


Наше тестирование показало, что, несмотря на найденные недочеты и замечания, серьезных проблем с надежностью нет, каких-либо серьезных несоответствий общепринятым нормам или стандартам заказчика нет.

© Habrahabr.ru