Запускаем МЕГА курс по SRE для МЕГАстабильной работы системы

0a530a95126a5df789c0e77ebd34e79d.png

22 сентября Слёрм запускает новый практический курс по внедрению редких для российского рынка инструментов SRE для повышения стабильности системы. В программу интенсивов вошли темы, которые принципиально отличают работу SRE-инженеров от практик DevOps.

SRE: Мега — это авторский курс от Senior Staff Engineer в Databricks Ивана Круглова. Ценность программы в том, чтобы внедрить инженерный подход к решению проблем с помощью продвинутых методов. Слепой перебор всех инструментов SRE может потратить дополнительное время и деньги. Мы сделали интенсивы, чтобы вы смогли разобраться в фишках SRE в тестовой среде и выбрать из них полезные именно для вашего бизнеса. Помимо практики вас ждут реальные кейсы по повышению стабильности от спикеров из российских и международных компаний. 

Я не знаю, нужен ли SRE моему бизнесу

Site Reliability Engineering создан для того, чтобы инженеры перестали надеяться на чудо и всегда держали в рукаве план «Б» на случай инцидентов. Если надежность приложения — это то, что приносит доход, а вашим пользователям важен удобный доступ к сервису, то вы по адресу.  Мы выделили следующие отрасли, где без SRE никак:

— финтех

— сервисы бронирования

— стриминговые платформы

— онлайн игры

— крупный ритейл

— каршеринг

— поисковики.

Собери свой конструктор

Мы выделили пять разделов, которые, по мнению наших экспертов, формируют в компании правильную культуру SRE.

Это курс-конструктор, где темы можно проходить по отдельности или сразу все вместе. Цена одного интенсива от 15 000 ₽, ну, а брать комплектом дешевле.

Что в программе:  

1. Observability

Приложения уходят из монолита в микросервисы, поэтому нужно уметь агрегировать множество SLO/SLI в одну или несколько метрик.  SRE-инженер должен грамотно оценивать бюджет ошибок и измерять надежность приложения.

2. Reliability architecture patterns

Паттерны того, как построить архитектуру надежной. SRE-инженер сделает так, чтобы система работала стабильно именно с точки зрения архитектуры.

Exponential backoff & jitter

Failovers & dummy server

Graceful degradation (don«t let new functionality fail main one).

3. Proactive reliability testing

Chaos Engineering

Обзор инструментов: Gremlin / ChaosMesh / ChaosBlade / ChaosKube / СhaosMonkey

Основные тесты: Slowness injection и Failure injection

Подготовка и планирование: формулирование целей и ожидаемого результата коммуникации, анализ данных.

— Capacity Planning

Load testing vs capacity testing

Виды capacity planning: Request mirroring/shadowing / Traffic amplification / Предсказания на основе исторических данных.

4. Intelligent delivery of changes

Не с точки зрения безопасности в плане взлома, а с точки зрения стабильности системы. Здесь подразумеваются практики разбиения больших изменений на много мелких, а именно методы правильного выкатывания этих изменений.

— Feature Flags

— Обзор продуктов — LaunchDarkly

— Флагов может быть очень много

— Как отслеживать

— Incremental rollouts

5. Incident management

SRE-инженер должен знать, как хендлить инцидент, как организовать дежурства в команде, выстраивать Shifts handovers, оформлять воркбуки и правильно вводить новичков в on-call.

Кому подойдет?

  • Тем, кто прошел базовый курс SRE;

  • Инженерам, которые хотят повысить отказоустойчивость системы и высвободить время на другие задачи;

  • Компаниям, которые уже внедрили SRE-практики, хотят усовершенствовать их применение и наладить внутренние процессы в команде.

Кто должен внедрять SRE?  

Когда все рушится, в завале проблем первыми страдают инженеры. У руководства не всегда есть время самостоятельно разбираться в SLI, SLO и SLA, чтобы потом прийти с идеями внедрить SRE-инструменты. 

Тут не помешает знать, как продать идею начальству и внедрить все с нуля. На бесплатном интенсиве по внедрению мы расскажем не про технологии, а именно про выстраивание процесса и его согласование.

Старт вебинаров: 22 сентября — 3 ноября 2022 г.

Занятия будут проходить вечером, поэтому можете прикоснуться к SRE практикам без отрыва от работы.
Оставить заявку для бесплатной консультации: https://slurm.club/3Dlyyr0

© Habrahabr.ru