Вышел шестой номер журнала ЦОДы.РФ

bb823583fc8cb0c6877f8d5bdff27362.pngЭксплуатация ЦОДа: ахиллесова пята? Как известно, ни один договор SLA не покрывает убытков от серьезной аварии в ЦОДе. А причиной 70% ин­цидентов в дата-центрах, по стати­стике, является человеческий фактор, т. е. ошибки персонала. Но стоит ли винить толь­ко персонал ЦОДа в случившихся происше­ствиях? Не лучше ли организовать процесс эксплуатации так, чтобы свести к минимуму число инцидентов и смягчить последствия от их наступления? Этот вопрос стал темой февральского выпуска журнала «ЦОДы.РФ». Эксплуатация может внести разную «леп­ту» в уровень отказоустойчивости дата-цен­тра. При плохой организации процесса экс­плуатации можно существенно понизить уровень надежности ЦОДа. Однако извест­ны примеры площадок, которые в реальной жизни функционируют без единого сбоя, в соответствии даже с более высоким уровнем устойчивости, чем было заявлено при проек­тировании объекта. При правильном проек­тировании и построении ЦОДа с разумным подходом к его эксплуатации инцидентов в дата-центрах практически не бывает. Конечно, пресловутый «человеческий фактор» полностью устранить невозмож­но. Но, как отмечает Грег Шерри, эксперт международного уровня в области эксплу­атации ЦОДов, зачастую проблема кроется не в конкретных исполнителях, а в качестве управления. Многие операторы, например, зачастую скрывают информацию о проис­шествиях. А иначе пришлось бы признаться в отсутствии плана выхода из аварийной си­туации, нерегулярности тестирования обо­рудования или даже в том, что проект был выполнен не на должном уровне, а обучению персонала уделялось мало внимания.Читать дальше →

© Habrahabr.ru