Опыт и проблемы ЦОД: Как проверить надежность дата-центра
Центр обработки данных Digital Beijing в Пекине
В наше время проектирование и создание центров обработки данных — достаточно хорошо изученная область. Были разработаны и установлены стандарты, которых придерживаются при построении дата-центров. В них расписаны обязательные и рекомендуемые требования, предъявляемые к инфраструктуре машинных залов, кабельным системам и конструкции сети. Однако, несмотря на весь имеющийся опыт, это занятие по-прежнему остается невероятно сложным.
Факты из жизни ЦОД
Первый вопрос, который стоит задать перед началом строительства дата-центра, –«где его строить?». Очень часто в центры обработки данных превращаются старые заброшенные склады или супермаркеты, поскольку к ним уже подведены все необходимые коммуникации. Если подходящих объектов поблизости нет, то строить нужно поближе к электростанциям, поскольку вам понадобится очень много электроэнергии. Вот тому подтверждение: новый дата-центр, который в 2012 году построила в округе Крук, США, социальная сеть Facebook, потребляет 28 мегаватт. Забавно то, что столько же потребляет весь округ Крук целиком.
Потому строители и владельцы многих современных дата-центров подходят к этому вопросу ответственно. Например, Apple постоянно стремится сократить расходы на электроэнергию. Если верить отчетам компании, то с 2013 года 100% их дата-центров и 94% офисов работают на возобновляемых источниках энергии. Дата-центр в Мейдене окружен солнечными батареями, которые занимают около 400 000 кв. метров площади и вырабатывают 42 миллиона киловатт-часов электроэнергии в год. В дата-центре Digital Beijing в Пекине используются исключительно светодиодные лампы, потребляющие на 60% меньше электричества, а специальная стеклянная стена препятствует проникновению внутрь тепла, снижая расходы на охлаждение.
Кстати об охлаждении. Далеко не секрет, что дата-центры выделяют огромное количество тепла, поэтому, чтобы избежать перегрева жизненно важных систем, его приходится отводить. Принято считать, что на охлаждение оборудования расходуется большая часть всей потребляемой мощности. Для отвода тепла от каждого сервера и роутера используется вода и сложные интеллектуальные системы кондиционирования. Иногда, правда, встречаются ситуации прямо противоположные: например, когда два «независимых» подвода питания исходят из единого источника.
Собираемая тепловая энергия часто просто рассеивается в воздухе, однако ситуацию можно в корне изменить. «Стоит подключить дата-центр к системе централизованного отопления», — уверен председатель координационного центра работников дата-центров в Финляндии Яри Иннанен (Jari Innanen). По словам Яри, с помощью воды, используемой для охлаждения финских ЦОД, можно обеспечить отопление 300 тысяч частных домов в стране. Такой подход уже применяется там же, в Финляндии: дата-центр российского «Яндекса» отапливает город Мянтсяля.
Когда дата-центр построен и функционирует, встает вопрос, а сколько нужно сотрудников, чтобы поддерживать его работу? Если речь идет о количестве людей «на месте», то совсем немного. Согласно заявлению Facebook, в их дата-центре, построенном в городке Прайнвилль в 2010 году, работают 35 человек. Если учесть размеры всего здания, то это всего 1 работник на 790 кв. метров. В их обязанности входит ремонт оборудования или его замена, обслуживание дизельных генераторов и оценка состояния всего объекта в целом.
Однако этих, так сказать, «местных» техников поддерживают сотни и даже тысячи системных администраторов, инженеров и программистов, работающих удаленно. Им не нужен непосредственный доступ к оборудованию (за исключением редких критических ситуаций), и они могут управлять практически всеми процессами по сети с помощью ПО.
А что с обеспечением безопасности? Ведь на серверах могут храниться не просто ваши фотографии котиков в Instagram. Здесь применяются разнообразные системы управления информационной безопасностью, системы резервного копирования и восстановления данных и системы защиты каналов передачи информации — все стандартно. Гораздо интереснее дела обстоят с защитой от внешних воздействий и проникновения. По словам Брэндона Беррихилла (Brandon Berryhill), инженера дата-центра, некоторые здания ЦОД способны выдерживать порывы ветра до 321 км/ч и землетрясения силой до 9 баллов.
Бронированная кабина со считывателем биометрических данных в дата-центре, где размещается облако ИТ-ГРАД
Разумеется, одни объекты гораздо лучше защищены, чем другие. Есть дата-центры, в которых между злоумышленником и серверами стоит лишь простенький сканер карт сотрудников, но есть места с толстыми стенами, пуленепробиваемыми дверями и колючей проволокой, где установлены биометрические сканеры, а на входе стоят до зубов вооруженные охранники. «Один мой коллега сказал, что в Европе есть дата-центр, вокруг которого вырыт ров. Жаль, что без крокодилов», — говорит Брэндон.
Современные реалии: проблемы дата-центров
К сожалению, в России (да и за рубежом) далеко не все дата-центры работают в таких условиях. Не все коммерческие дата-центры сертифицированы по классу надежности, не говоря уже о проведении независимого внешнего аудита, подтверждающего сертификацию. Иногда компания-владелец ЦОД ограничивается словами о том, что они провели «внутренний аудит», и основываются на самостоятельной оценке уровня надежности дата-центра.
В первую очередь, это связано с тем, что процесс сертификации ЦОД стоит немалых денег. При этом сертификации подлежат даже чертежи будущего дата-центра, а после его постройки специалисты Uptime Institute (независимый аудитор соответствия ЦОД требованиям отказоустойчивости) проверяют результат, оценивают соответствие систем дата-центра заявленным значениям и размещают информацию о ЦОД и присвоенном ему Tier сертификате в каталоге UTI.
Очень часто такая проверка не производится: помимо организации процесса сертификации принимающей стороне (владельцу ЦОД) необходимо обеспечить приезд и проживание аудиторов, а также длительные и тщательные проверки, поэтому порой компании ограничиваются оценкой надежности на основе собственных представлений. При этом оценку иногда проводят для каждой подсистемы по отдельности, а в качестве итоговой выбирают наиболее высокое значение.
Подозрительными могут быть и уровни надежности с «плюсами», вроде Tier 3+. Фактически это означает, что один из элементов системы выполнен надежнее остальных, что не увеличивает надежность всей системы в целом, но позволяет утверждать, что ЦОД соответствует более высоким требованиям надежности в сравнении со стандартом. Такие «плюсы» зачастую являются маркетинговым ходом (подробнее об этом мы писали здесь).
Как избежать рисков
В первую очередь, стоит доверять свои данные дата-центрам, прошедшим сертификацию. При отсутствии таковой, клиент, конечно, может попытаться самостоятельно оценить состояние ЦОД, однако это обычно бывает сопряжено с рядом трудностей: понадобится детальная информация о дата-центре, включая данные по инженерным коммуникациям и проч. С одной стороны, на анализ и оценку этой информации уйдет достаточно много времени (причем времени квалифицированного специалиста), с другой — велика вероятность, что руководство, сэкономившее на строительстве дата-центра, не будет готово предоставить подобные данные клиенту.
Помимо вопросов сертификации стоит изучить юридический статус ЦОД (есть ли у провайдера все необходимые разрешения от государственных инстанций), а также узнать, заключила ли компания-провайдер контракты на обслуживание и поддержку систем в случае наступления аварийной ситуации — например, в случае погодной аномалии (об этом часто забывают, сводя все вопросы к надежности самой системы).
Обратите внимание и на возможность посещения дата-центра: если вам отказывают в экскурсии, у вас может возникнуть резонный повод для беспокойства. И наоборот: если компания готова показать вам машинный зал и инженерные помещения, у вас появляется больше причин доверять провайдеру. Например, компания-провайдер, дата-центр которой использует ИТ-ГРАД, не только провела экскурсию по своему ЦОД, но и предоставила подробную информацию для нашего материала, в котором мы рассказываем о том, где размещается наше облако, как обеспечивается связь, охлаждение, безопасность объекта и другие нюансы, связанные с выбранным нами ЦОД.