Маршрут до SRE построен
Путь к Site Reliability Engineer лежит через богатый опыт, знания по мониторингу, observability и SRE-практикам. Собрали в один комплект три курса Слёрма, которые помогут преодолеть этот путь.
Шаг 1. Курс «Мониторинг в Grafana».
Grafana — мощный инструмент для мониторинга и визуализации данных. Он позволяет создавать информативные дашборды о состоянии системы, интегрировать его с другими системами мониторинга, использовать для отслеживания метрик и статистики приложений.
Но перед тем, как научиться собирать дашборды и читать графики, нужно освоить сбор метрик. Это в курсе тоже есть — будем работать со связкой Prometheus+Grafana.
Вот что ещё будет на этом курсе:
✔️ Разберёмся, зачем нужен мониторинг и дадим ему определение, узнаем о методологии.
✔️ Настроим необходимое для работы окружение: именно Grafana, Prometheus и Alertmanager.
✔️ Разберёмся с моделью данных в Prometheus. Узнаем, какие типы метрик есть, чем они отличаются и для чего используются.
✔️ Научимся работать с основными функциями PromQL и напишем несколько запросов.
✔️ Соберем первый dashboard »4 goled signals» и проверим определенные метрики.
✔️ Узнаем более продвинутые техники для работы с Grafana