Вышел шестой номер журнала ЦОДы.РФ
Эксплуатация ЦОДа: ахиллесова пята? Как известно, ни один договор SLA не покрывает убытков от серьезной аварии в ЦОДе. А причиной 70% инцидентов в дата-центрах, по статистике, является человеческий фактор, т. е. ошибки персонала. Но стоит ли винить только персонал ЦОДа в случившихся происшествиях? Не лучше ли организовать процесс эксплуатации так, чтобы свести к минимуму число инцидентов и смягчить последствия от их наступления? Этот вопрос стал темой февральского выпуска журнала «ЦОДы.РФ». Эксплуатация может внести разную «лепту» в уровень отказоустойчивости дата-центра. При плохой организации процесса эксплуатации можно существенно понизить уровень надежности ЦОДа. Однако известны примеры площадок, которые в реальной жизни функционируют без единого сбоя, в соответствии даже с более высоким уровнем устойчивости, чем было заявлено при проектировании объекта. При правильном проектировании и построении ЦОДа с разумным подходом к его эксплуатации инцидентов в дата-центрах практически не бывает. Конечно, пресловутый «человеческий фактор» полностью устранить невозможно. Но, как отмечает Грег Шерри, эксперт международного уровня в области эксплуатации ЦОДов, зачастую проблема кроется не в конкретных исполнителях, а в качестве управления. Многие операторы, например, зачастую скрывают информацию о происшествиях. А иначе пришлось бы признаться в отсутствии плана выхода из аварийной ситуации, нерегулярности тестирования оборудования или даже в том, что проект был выполнен не на должном уровне, а обучению персонала уделялось мало внимания.Читать дальше →