Одержимость клиентом. «ВымпелКом» поменял систему мониторинга, чтобы отслеживать клиентский опыт

15 Февраля 2022 10:0015 Фев 2022 10:00 |
Поделиться

Цифры ущерба от простоя сервисов в крупных компаниях обычно поражают. Например, в ритейле потери от сбоев бизнес-приложений составляют от 300 до 800 млн рублей в год. Вдобавок, даже если приложение не работает всего несколько минут, клиент задумывается о том, чтобы перейти к конкуренту. Как компании могут противостоять потерям по причине сбоев ИТ-систем и сохранять позиции на высококонкурентных рынках? «ВымпелКом» одним из способов решения этих задач видит создание единой системы мониторинга ИТ. А параллельно, объединив данные из разных ИТ-систем, еще и получил возможность наблюдать качество сервиса глазами клиента.

Телеком-операторы переживают сейчас такую острую конкуренцию, что высокое качество услуг стало базовым принципом при выборе того или иного оператора со стороны абонента. Вокруг клиента, его болей и ожиданий выстраиваются сервисы. «Конкуренция стимулирует нас выпускать и поддерживать продукты высокого качества, мгновенно реагировать на возникающие отклонения и устранять их. Потому что в новой парадигме клиент должен получать позитивные впечатления от взаимодействия с компанией при использовании любого продукта и сервиса. Это может быть первый контакт человека с компанией или же банальное пополнение счета онлайн. В клиентоцентричной стратегии нашей компании есть даже специальный термин — «одержимость клиентом», — объясняет Сергей Агеев, директор по развитию сервисов «ВымпелКома».

Связь между качеством услуг, которое воспринимает потребитель, и ИТ довольно сложно проследить. «В »ВымпелКоме», чтобы видеть малейшие изменения в работе приложений, оборудования и ИТ-инфраструктуры в целом, ставку сделали на систему мониторинга. Обычно такие решения создаются, чтобы не допускать инцидентов, а в крайнем случае — известить ответственных о проблеме с сервисами как можно раньше, а не после шквала звонков в техподдержку, говорит Алексей Акопян, руководитель направления мониторинга«Инфосистемы Джет». Оператор же смог »привязать» утилитарную систему мониторинга к клиентскому опыту и видеть их взаимосвязь».

Быстрый старт с открытым ПО

ИТ-команда «ВымпелКома» продумала архитектуру будущего решения. А внедрением системы мониторинга ИТ-инфраструктуры, поддерживающей как внутренние бизнес-сервисы, так и те, с которыми имеют дело клиенты оператора, занималась компания «Инфосистемы Джет».

На мониторинг на основе Zabbix «поставили» серверы с различными операционными системами, системы хранения данных, сетевое оборудование, системы резервного копирования, приложения и виртуальные машины. А чтобы видеть состояние бизнес-сервисов, специалисты интегрировали систему с существующей базой данных управления конфигурациями (CMDB). Это и предопределило новый статус мониторинга ИТ у оператора. По мнению ИТ-блока «ВымпелКома», единая система мониторинга должна оценивать не отдельные компоненты ИТ, а то, как будет выглядеть клиентский опыт при взаимодействии с ними. «Источники многочисленной диагностической информации, объединенные в централизованную систему мониторинга, наблюдение групп метрик, включенных в SLA, и ресурсно-сервисные модели анализа позволяют нам делать выводы о влиянии на клиентские операции. А при возникновении нештатной ситуации мы определяем, пострадавших от сбоя клиентов, чтобы устранить последствия и предоставить им быструю помощь», — отмечает Сергей Агеев.

Визуализация работы ИТ-мониторинга организована на ПО Grafana и имеет трехуровневую структуру. Комплексный дашборд представляет обзор девяти основных направлений, например серверов, СХД и пр. На втором уровне отображается суммарная статистика по каждому направлению. Третий уровень дает сведения о конкретных устройствах с визуализацией текущей нагрузки и динамики ее изменений. Сейчас в одной консоли можно контролировать состояние всей ИТ-инфраструктуры по ключевым параметрам и индикаторам: от бизнес-сервиса до датчика работы вентилятора.

Выбор Open Source продуктов для новой системы мониторинга продиктован не только экономикой. «Мы понимали, что «решения из коробки» закроют часть наших задач и обеспечат простые интеграции с такими же «коробочными» информационными системами. Универсального мониторинга не существует: чем более специфичные метрики нужно собирать, тем более кастомизированная разработка потребуется, — комментирует Сергей Агеев. —Мы пошли по другому пути. Создали платформу, с помощью которой продуктовые команды смогут сами, в идеале автоматически, настроить мониторинг своих метрик, заложив на этапе планирования разработки использование предоставленного цифрового ИТ-сервиса, позволяющего встраивать в код создаваемых приложений анализатор функционирования ПО».

Грамотная настройка open source продуктов позволила собирать, агрегировать источники данных, получать необходимую аналитику и визуализацию. В дополнение к этому инженеры «Инфосистемы Джет» разработали способы сбора информации для нетипового оборудования и «модель здоровья» — правила (триггеры), при достижении которых система сообщает о рисках сбоев.

Увлечение контролем

Каких результатов удалось достичь? Новая система мониторинга отслеживает, как функционирование ИТ-компонентов влияет на работу более 180 приложений и бизнес-сервисов. Кроме того, она стала основой для точного планирования развития ИТ-инфраструктуры. Анализ данных о потребленных ИТ-мощностях помогает формировать оптимальную инвестиционную программу в части приобретения оборудования и системного ПО.

В результате реализации проекта удалось улучшить информирование команд поддержки о неполадках в системах, что значительно перестроило работу инцидент-менеджмента. «Мы планируем построить работу так, чтобы узнавать об инцидентах еще до обращения клиентов. Тогда мы сможем сразу сообщить абоненту, когда проблема будет решена, а в финале оповестить его о полном восстановлении сервиса», — рассказывает Сергей Агеев.

Путь к единству

В целом опыт «ВымпелКома» — частный пример того, как сегодня крупный бизнес переходит от множества разрозненных систем мониторинга к единому средству контроля ИТ-инфраструктуры. Например, у оператора до начала проекта было несколько систем.»Они оценивали состояние отдельных сервисов и фрагментов ИТ-инфраструктуры, не создавая общей картины, — делится подробностями Сергей Агеев. — Раньше проектные команды часто организовывали мониторинг, исходя не из целей, а из того, какое решение доступно. Так появилось несколько неоптимальных с точки зрения ТСО ландшафтов и систем мониторинга. В итоге продукт «под мониторингом» рассматривался локально, изолированно от так называемого клиентского пути — customer journey».

ИТ-инфраструктура и средства ее мониторинга в том числе часто развивались подобным образом. Появлялись новые задачи — под них внедрялись решения и системы мониторинга. В отдельных случаях их число даже переваливало за десяток. Но сегодня наметился переход к иной парадигме. «Без единой системы мониторинга увидеть точки развития невозможно. Одна система скажет, что сеть в порядке. Другая отрапортует, что серверы тоже ок. И вот мы оказываемся в ситуации ложной позитивности: всё хорошо, но ничего не работает! Бизнес хочет оценивать здоровье всех сервисов. Поэтому сейчас мы видим, как крупные компании разных отраслей создают единые системы мониторинга, — объясняет Алексей Акопян из «Инфосистемы Джет». Нет цели перейти на одну систему. Достаточно хотя бы сократить их число, проработать элементарные интеграции и информативную визуализацию, сделать удобным их управление и получить, наконец, общую картину по предприятию. И это вполне возможно».

Полный текст статьи читайте на CNews