Всё под контролем. Зачем нужны системы мониторинга инженерной инфраструктуры центров обработки данных

Хабр, привет!

Я ведущий инженер компании «ЛАНИТ-Интеграция». Работаю здесь больше 20 лет. Последние семь лет занимаюсь инженерным обеспечением ЦОДов: устанавливаю и запускаю оборудование в работу.

С каждым годом появляется всё больше требований к надежности и удобству использования дата-центров. Однако этого нельзя добиться, если сосредоточиться только на резервных копиях систем и качестве отдельных элементов. На рынке понимают эту простую мысль, поэтому компании всё чаще внедряют единую систему мониторинга. Если коротко, она следит за инженерной инфраструктурой ЦОД и помогает избежать аварийных ситуаций.

В статье я расскажу о готовых программно-аппаратных решениях мониторинга, которые мы с коллегами используем в проектах.

9c453884737014dfd8dd48bcb28f88d9.jpg

Источник
Для начала расскажу о том, из чего состоит основа центра обработки данных. Её разделяют на три составляющих.

  • Телекоммуникационная система принимает и передаёт данные между ЦОД и его пользователями, а также связывает элементы центра.
  • Техническая архитектура — это серверы доступа, серверы приложений, серверы СУБД, системы хранения данных. Она отвечает за функционирование бизнес-приложений и позволяет пользователям получить к ним доступ.
  • Инженерная инфраструктура делает так, чтобы все системы исправно работали, то есть поддерживает для них оптимальные условия.


Инженерная инфраструктура дата-центров тоже делится на две подсистемы:  функционирования и безопасности. Первая включает системы общего, гарантированного и бесперебойного электроснабжения, технологического кондиционирования, монтажные конструктивы. В подсистему безопасности входят охранно-пожарная сигнализация, системы автономного газового пожаротушения, видеонаблюдения, контроля и управления доступом.

Для уверенности, что все системы работают в штатном режиме, нужен постоянный контроль, который и даёт мониторинг.

52c563b904fbf24e3a816d61d8704b8d.jpg

Источник

Мониторинг помогает инженерам, обслуживающим ЦОД, комфортнее работать. Без него специалисты должны либо жить и трудиться всё время рядом со шкафами, либо выходить из кабинета и бежать к ним каждый раз, когда возникла какая-то проблема или есть подозрения, что она может случиться.

e8076dc0d9d21b618b672de4199a2b97.jpg

Источник

Мониторинг в реальном времени показывает, как работает инфраструктура ЦОД. За показателями, как правило, следит дежурная смена. При возникновении отклонения или нештатной ситуации сотрудники дежурной смены  могут вовремя предотвратить критическую ситуацию или же свести её последствия к минимуму. Также система мониторинга собирает данные о параметрах, статусе оборудования, следит за сроками сервисного обслуживания, наработанными часами и т.д.

Что именно контролирует система мониторинга и какие задачи решает?

  • Следит за параметрами питающей электрической сети и состояния автоматических выключателей;


88f57c7b530b3fc40897680dc9255352.jpg


4f6ca4bab422d413ecd0ceea81242f36.jpg


  • контролирует состояния и параметры работы источников бесперебойного питания;


164bb9c98de9fbdd5169b25e06a777ca.jpg


  • мониторит состояния и параметры работы холодильных машин, кондиционеров и вентиляционных установок;


9bc22ce3862479ab9ce0ceeb3fa1aaef.jpg


  • собирает данные о температуре и влажности воздуха, узнаёт о наличии протечек и задымления в ЦОД;


2074b945ba4fa22e596b136b6750c27f.jpg


  • создаёт отчёты и графики по требуемым параметрам;


647dc19b97137767dca428d17fa3d7a6.jpg


  • отправляет уведомления о любых событиях и аварийных ситуациях;


4ce4e9178a6461f5858669e985a24248.jpg


Защита от людей


К сожалению, статистика говорит, что множество аварийных ситуаций с техникой возникает по вине человека. Именно поэтому мониторинг в том числе следит не только за параметрами, но и за теми, кто имеет доступ к ЦОД и кто/что в нем делает.

f3cbd550286b004b9c67d3d5f3bbd04d.jpg
Виды систем мониторинга
Существует множество различных систем, так или иначе позволяющих контролировать параметры и работу различных типов  оборудования — мониторинг IT-систем, мониторинг СКС/ЛВС, мониторинг инженерных систем и т.д.

По типу реализации системы делятся на программные, аппаратные и гибридные решения.

По уровню контроля системы мониторинга делятся на распределенные и централизованные.

Распределенные системы позволяют отслеживать состояние одного или нескольких однотипных устройств.

Централизованные системы дают возможность объединить всё контролируемое оборудование, в том числе и несколько распределенных систем, в единую систему, позволяющую наблюдать за работой всего оборудования в «одном окне».


dd7c1fc8b9538e64c80e8b2c962bf4f8.jpg

Источник

Из чего состоит


Уже много лет мы с коллегами работаем с системой мониторинга NetBotz и системой управления инфраструктурой ЦОД StruxureWare Data center Expert от APC by Schneider Electric. У нашей команды есть партнёрская сертификация направления DCIM.

У большинства производителей инженерного оборудования существуют комплексные решения. С их помощью можно создать инженерную инфраструктуру ЦОД «под ключ» и собрать систему мониторинга «из кубиков».

Это:

  • контроллеры мониторинга — устройства, к которым подключаются всевозможные датчики и которые собирают с этих датчиков информацию;
  • расширители портов для подключения датчиков — дополнительные блоки, которые подключаются к контроллерам мониторинга для увеличения количества подключенных датчиков;
  • датчики температуры, влажности, протечки, задымления, открытия двери, обнаружения движения, вибрации, аналоговые датчики 4–20 мА и 0–5 вольт, сухие контакты и т.п.;
  • устройства контроля и ограничения доступа как в коммуникационные шкафы, так и в помещения;
  • камеры видеонаблюдения.


Однако у готовых систем есть и минусы. Как правило, каждый производитель предлагает систему мониторинга своего оборудования, то есть того, которое производит сам. Конечно, очень удобно, когда инфраструктура ЦОД строится на оборудовании одного бренда. Внедрение такой системы занимает мало времени, нет проблемы с подключением и распознаванием параметров оборудования.

8dce0debc42c4ab8838486893f7a3190.jpg

Источник

Предсказуемо, что главная проблема таких систем — это подключение оборудования сторонних производителей. Бывает, что такие системы поддерживают некоторые типы и модели оборудования сторонних производителей, но для корректного подключения и отображения параметров очень часто требуются дополнительные действия и время.

Например для подключения устройств других брендов, подключаемых по протоколу MODBUS к системе Data center Expert от APC, не входящих в список поддерживаемого, приходиться обращаться в службу поддержки. При этом нужно предоставить технические данные на подключаемое оборудование, заполнить несколько форм и подождать около месяца. Своими силами это сделать практически невозможно.

Установка и настройка


От теории к практике. Первую систему мониторинга мы установили в 2010 году. Всего мы реализовали более 15 систем мониторинга ЦОД. С одной стороны, работа каждый раз одинакова, с другой стороны, у каждого заказчика свои условия и требования, поэтому каждый проект запоминается чем-то своим. Ниже я расскажу о самых интересных проектах за последние несколько лет.

НИС ГЛОНАСС


Два центра обработки данных находились в Москве и в Санкт-Петербурге. Их связали единой системой мониторинга инженерной инфраструктуры. В этом проекте впервые пришлось разделять права пользователей для доступа к группам устройств. Как это? Специалисты из Москвы контролировали все устройства в обоих ЦОД, а специалисты в Санкт-Петербурге контролировали только свою часть оборудования.

1552f1e582903e98ab6334df92bbc1e9.jpg


Проект для металлургического комбината


Нашей команде впервые пришлось «прикручивать» к системе мониторинга StruxureWare Data center Expert оборудование сторонних производителей, дизель-генераторную установку, щит автоматики и щит управления системой кондиционирования. Не обошлось без помощи западных специалистов службы поддержки производителя системы мониторинга. Они за месяц написали драйверы для нужных нам устройств.

5c2b5aaae20afab56803363add65a473.jpg


0fabef5eb23f6bd780274d7baaaab43c.jpg


Научно-исследовательское подразделение госкорпорации


Здесь помимо стандартного решения мы впервые реализовали мониторинг щита вводного распределительного устройства с автоматическими рубильниками, управляемого программируемым реле ZelioLogic, щита распределения питания с контролем состояния автоматических выключателей на контроллере Acti-9 SmartLink и счетчиков электроэнергии PowerLogic от компании Schneider Electric.

427c846e0fd5d097281d288653de9b0d.jpg


Технопарк


Мы впервые в стране реализовывали системы мониторинга и системы управления инфраструктурой ЦОД с применением 190 беспроводных датчиков температуры и влажности, расположенными в 6 машинных залах и 4 аппаратных.

67dcd4f2af4250dd62c39b502f82792f.jpg


Относительно скоро стартует ещё один крупный проект. Для нас это будет новый опыт. Предстоит внедрять системы мониторинга RAMOS и систему управления инфраструктурой ЦОД Aegis DCIM (чешский производитель CONTEG). Возможно, снова появится повод, о чём вам рассказать.

Кстати, наша команда всегда ищет талантливых и увлеченных профессионалов.

© Habrahabr.ru