Как избежать серьезных сбоев в цифровой инфраструктуре и не повторить опыт Facebook?18.11.2021 13:33

17 Ноября 2021 18:4017 Ноя 2021 18:40 |

Чуть более месяца назад в результате серьезного сбоя сервисы одного из крупнейших мировых брендов были недоступны более чем шесть часов, что коснулось миллионов пользователей. Вполне возможно, что проблема подобного масштаба может повториться и снова, поскольку у большинства корпораций цифровые инфраструктуры крайне загружены. ИТ-команды вынуждены ускоренно внедрять инновации, работать с растущей сложностью приложений и при этом удовлетворять высокие требования пользователей по качеству обслуживания. В этих процессах ключевое значение для разработчиков имеет сквозной мониторинг технологического стека. Рассказывает Любовь Сирая, региональный директор AppDynamics в России.

Какие последствия могут быть у сбоев?

Недавно вышедшее исследование App Attention Index 2021 показывает, что

перебои сервисов и приложений могут привести компании к значительным финансовым и репутационным потерям. 56% россиян не готовы мириться с плохой производительностью и вне зависимости от факторов винят бренд, с легкостью переходя к конкурентам в случае проблем с онлайн-обслуживанием. Неудивительно, что такие угрозы не дают технологам спокойно спать по ночам. После недавних событий компания AppDynamics провела опрос 1000 руководителей ИТ-служб в 11 странах, чтобы изучить их отношение к сбоям в работе цифровых сервисов.

Опрос показал, что 87% корпоративных технологов обеспокоены возможностью серьезных нарушений работы их инфраструктуры. Более того, 84% опрошенных сообщили, что даже подвергались давлению со стороны своего руководства, поскольку топ-менеджмент опасается далеко идущих последствий проблем с производительностью, влияющих на взаимодействие бренда с пользователями. Все это заставляет технологов прикладывать все больше усилий, чтобы поддерживать работу приложений для бесперебойного и качественного онлайн-обслуживания.

Ускоренное внедрение инноваций

Однако сказать гораздо проще, чем сделать. Пандемия COVID-19 заставила компании из всех отраслей промышленности ускорить внедрение инноваций. Это привело не только к чрезмерной нагрузке инфраструктуры, состоящей из традиционных и облачных технологий, но и сказалось на работоспособности и мотивации ИТ-специалистов. 87% респондентов заявили, что возросшая сложность привела к длительным задержкам в выявлении причин сбоев.

Нагрузка с инфраструктур не исчезнет сама по себе. Поскольку потребность в ускоренном внедрении инноваций будет расти и далее, ситуация будет только ухудшаться. Какие шаги могут предпринять ИТ-команды? 97% опрошенных уже имеют те или иные инструменты для мониторинга, и многие из них предоставляют даже расширенные возможности для выявления и устранения аномалий. Однако технологи сомневаются в эффективности этих решений, учитывая совершенно новую нагрузку на технологические стеки. Фактически, только 27% респондентов полностью уверены в том, что имеющиеся у них инструменты мониторинга полностью соответствуют их реальным потребностям.

Это подтверждает и недавнее исследование Trend Micro Incorporated, которое выяснило, что специалисты, работающие в организациях с более чем 10 тысячами сотрудников, имеют дело в среднем с почти 46 инструментами для мониторинга. При этом почти половина специалистов не использует значительную часть имеющихся у них инструментов из-за сложности решений, отсутствия доверия к ним или нехватки квалификации. Существует выбор разрозненных решений под узкопрофильные задачи ИТ-команд, которые приводят не к полноценному сквозному наблюдению всего стека, а лишь к усложнению рутинных задач.

Найти источник проблем

ИТ-команды нуждаются в наблюдаемости всего технологического стека, которая даст понимание, как работает и взаимодействует вся система, а не только ее отдельные компоненты. Опрос по всему миру показал: 72% ИТ-специалистов считают интеграцию решений для сквозного мониторинга ИТ-инфраструктуры обязательной в течение ближайшего года, если компании хотят понимать, почему происходят те или иные проблемы с производительностью приложений.

Решение для сквозной наблюдаемости должно охватывать всю инфраструктуру, от приложений для клиентов и сотрудников, до низкоуровневых компонентов, таких как вычислительные ресурсы, хранилище и сеть. Также это позволит проанализировать зависимости между службами, что позволит легко понять главную причину и источник неполадок.

Конечно, устранить все проблемы невозможно. Однако специалисты в силе предиктивно реагировать на потенциальные цифровые угрозы, для чего и созданы решения по сквозной наблюдаемости стека. Более того, такой подход даст ИТ-командам возможность связать производительность компонентов цифровой инфраструктуры с бизнес-результатами. Это позволит им правильно расставлять приоритеты действий и инноваций на основе актуальных данных, что приведет к грамотной коммуникации с топ-менеджментом, для которого финансовые показатели являются более понятным критерием успешности работы.

Полный текст статьи читайте на CNews