Red Hat + Lenovo: структура системы управления выделением ресурсов в Правительстве Московской области
Привет, Хабр! Сегодня мы расскажем небольшую историю о том, как можно удобно и эффективно управлять процессами выделения ресурсов. И, по доброй традиции, сделаем это на настоящем примере, который у нас вновь российский и вновь связан с правительственными структурами. В этот раз, правда, поговорим не о тендерах, а о программных решениях.
Итак, заказчиком проекта выступило Правительство Московской области. Условия на старте были таковы: одна небольшая группа администраторов отвечала за всю IT-инфраструктуру, обслуживала все органы государственной власти и обеспечивала работу всех автоматизированных систем. В общей сложности нужно было работать более чем с четырьмя десятками ведомств, из которых постоянно приходят запросы на выделение ресурсов. В какой-то момент стало понятно, что техническому персоналу сложно справляться с нагрузкой, необходимо было придумать хорошее решение, которое не только снизит эту нагрузку, но и позволит эффективнее управлять имеющимися мощностями.
Заказчик сразу точно знал, что будет использоваться всего одна среда виртуализации – остановились на VMware. При этом несколько ЦОД находились в разных географических точках под независимым управлением разных серверов. Помимо необходимости собрать всё это воедино на уровне софта, стояли четыре основных задачи:
- Пользователи должны запрашивать ресурсы в системе самообслуживания.
- Специалисты органов государственной власти и подрядчиков должны разворачивать нужные сервера в рамках выделенных ресурсов.
- Должна быть использована ролевая модель доступа к различным информационным системам.
- За центральным IT-подразделением должна сохраняться функция контроля за принципиальным компонентами инфраструктуры и работоспособностью систем.
Решить все эти задачи удалось при помощи платформы Red Hat CloudForms. Получившаяся схема работы СУВР выглядит следующим образом:
Ключевая особенность заключается в том, что всё приведено к одной точке принятия решений. Конфигурации проходят через Service Desk, инженеры второго уровня поддержки подтверждают или отклоняют заявки, могут регулировать запросы пользователей и при этом чётко понимают, что они делают и зачем делают, т.к. видят подробную статистику. Всё, что связано с потреблением ресурсов, абсолютно прозрачно: всегда можно проверить, действительно ли то, что запросили, используется по максимуму и правильно. Если всё же нет, то под рукой есть вся статистика для того, чтобы такие операции оспорить. Возникает сильный аргумент при решении сложных споров о производительности тех или иных систем.
Отчётности, которую даёт CloudForms, оказалось вполне достаточно: это инвентаризация машин и приложений, аналитика потребления ресурсов и утилизации и построение отчётов по состоянию инфраструктуры.
У пользователей есть свой интерфейс с определённым набором простых функций, при помощи которых можно сформировать свои виртуальные машины и назначить им определённые роли. Выйти за пределы запрошенного ресурсного пула система не даёт – для расширения ответственный за информационную систему сотрудник должен доказать, что ему это действительно нужно.
Кроме того, вся инфраструктура была шаблонизирована для того, чтобы исполнителям, которые реализуют системы, было проще и понятнее выбирать заготовки для тех или иных ролей серверов. Хотя возможность установки из кастомных ISO-образов осталась. Но, в случае необходимости работы с последними, сначала проводится проверка. Если оказывается, что в дальнейшем система станет необслуживаемой, то в выделении отказывают.
Дело не обошлось без системы защиты от разъярённого пользователя. Нельзя просто взять и нажать на кнопку «Удалить». Такой запрос тут же попадает на исполнение в Service Desk, и удаление может произойти лишь после подтверждения операции администратором.
Также включена нативная поддержка Active Directory. Чтобы получить доступ к системе, пользователь должен пройти несложный процесс регистрации. Поскольку речь идёт о Правительстве Московской области, то вопросы безопасности и внутреннего понимания того, кто за что отвечает, всё-таки очень важны. Есть несколько пулов, внутри которых пользователь может иметь разные статусы. Управляет всеми пользователями администратор, причём делает это самостоятельно, без обращения к IT-службе, что сильно снижает нагрузку на небольшую команду высокоуровневой поддержки.
На этапе создания консоли управления специалисты Правительства Московской области обратились за помощью к VMware, но от ответного предложения купить vCloud Director пришлось отказаться. Впрочем, найденное решение оказалось очень удобным: всё-таки нашлась возможность вывести консоли виртуальных машин напрямую в браузер, используя чистый HTML 5 и не обращаясь к сторонним плагинам.
Какие у созданной системы есть преимущества? Всё очень просто. Во-первых, заказчик получает весь набор исходных кодов и поэтому в дальнейшем может осуществлять весь процесс сопровождения (или даже доработки) самостоятельно. Во-вторых, подход Red Hat предполагает работу в рамках исторически сложившейся инфраструктуры – создаётся надстройка над системой виртуализации, а основа не меняется и не дополняется без крайней необходимости. И, наконец, Red Hat CloudForms – это удобная витрина для всех, которая снижает нагрузку на администраторов, предоставляет понятный русскоязычный интерфейс пользователям, не требует хранить в памяти несколько логинов/паролей, и при этом дает очень подробную информацию обо всех процессах.
Такая платформа может быть полезна любому крупному федеральному госучреждению с разветвленной, либо географически распределённой структурой IT, где требуется выделение ресурсов, есть системы вроде SAP, ERP и т.п. Опыт показывает, что в подобных случаях помимо «боевых» систем нужны и тестовые среды.
Также CloudForms может быть интересен крупным корпорациям, где есть ферма VMware, включающая в себя более 50 хостов. Здесь, скорее всего, тоже нужна виртуализация, есть деление на production, test и development, а управляющих консолью людей существенно меньше чем тех, кто отправляет им запросы.
Статистика по используемому Правительством Московской области оборудованию на апрель 2015 года выглядела следующим образом: СУВР работала с 27 АИС, 2522 vCPU, 3987 ГБайт RAM и 252 ТБайт на HDD. От себя скромно добавим, что значительная часть этого оборудования – это серверы Lenovo.
Недавно мы расширили линейку наших серверных решений: в продажу поступило новое поколение серверов System x M5, отлично подходящих для работы с «большими данными» и виртуализацией. Например, System x3650 M5 поддерживают до 14 дисков форм-фактора 3,5 дюйма для хранения данных плюс два 2,5-дюймовых диска для операционной системы и софта. Если использовать LFF-накопители с ёмкостью 6 ТБайт и SFF-накопители с ёмкостью 1,8 ТБайт, можно достичь общего объёма в 87,6 ТБайт.
В поколении серверов M5 используются процессоры Intel Xeon E5-2600 v3, максимальный объём оперативной памяти может достигать 1,5 ТБайт, поддерживаются различные варианты ускорения дисковой подсистемы (SSD диски и PCIe SSD адаптеры). Для дополнительной отказоустойчивости гипервизор может быть установлен на две внутренние SD-карты, собранные в массив RAID-1. Кроме этого, в каждом нашем сервере установлена система предсказания сбоев (Predictive Failure Analysis, PFA), которая в автоматическом режиме следит за состоянием аппаратных компонентов сервера: процессорами, модулем питания процессора (VRM), памятью, дисками, вентиляторами и блоками питания. Событие системы PFA является сервисным случаем и позволяет заменить неисправную запчасть по гарантии. Благодаря всем этим функциям поколение серверов М5 является идеальной платформой для построения отказоустойчивых виртуальных сред.
Согласно недавнему исследованию ITIC, серверы Lenovo System x третий год подряд становятся самыми надёжными решениями среди всех серверов x86. Вместе с серверами мы предлагаем программное обеспечение XClarity, которое помогает упростить управление большим кластером благодаря автоматическому обнаружению, инвентаризации и быстрому выделению ресурсов.
Практически все наши актуальные на сегодняшний день машины сертифицированы компанией Red Hat, так что за совместимость и быстродействие ПО можно не переживать. Кроме того, Lenovo давно сотрудничает с Red Hat, так что вместе мы можем реализовывать проекты наподобие описанного выше в достаточно сжатые сроки. При этом есть возможность связать гарантию Lenovo и поддержку Red Hat в один удобный комплекс со сроком действия вплоть до 5 лет с момента покупки серверов и создания СУВР. Кстати, обозначенная в начале материала схема – это, по сути, основа, которую при необходимости несложно расширить. О том, как это делается, мы можем рассказать в других материалах, если у уважаемых читателей Хабра такой интерес возникнет.
Спасибо за внимание!