Маршрут до SRE построен

Путь к Site Reliability Engineer лежит через богатый опыт, знания по мониторингу, observability и SRE-практикам. Собрали в один комплект три курса Слёрма, которые помогут преодолеть этот путь.

fd6fa90b7a7d4c67544a2f6e3895c089.png

Шаг 1. Курс «Мониторинг в Grafana».

Grafana — мощный инструмент для мониторинга и визуализации данных. Он позволяет создавать информативные дашборды о состоянии системы, интегрировать его с другими системами мониторинга, использовать для отслеживания метрик и статистики приложений. 

Но перед тем, как научиться собирать дашборды и читать графики, нужно освоить сбор метрик. Это в курсе тоже есть — будем работать со связкой Prometheus+Grafana.

Вот что ещё будет на этом курсе:

✔️ Разберёмся, зачем нужен мониторинг и дадим ему определение, узнаем о методологии.

✔️ Настроим необходимое для работы окружение: именно Grafana, Prometheus и Alertmanager. 

✔️ Разберёмся с моделью данных в Prometheus. Узнаем, какие типы метрик есть, чем они отличаются и для чего используются. 

✔️ Научимся работать с основными функциями PromQL и напишем несколько запросов.

✔️ Соберем первый dashboard »4 goled signals» и проверим определенные метрики.

✔️ Узнаем более продвинутые техники для работы с Grafana

© Habrahabr.ru