Запускаем МЕГА курс по SRE для МЕГАстабильной работы системы
22 сентября Слёрм запускает новый практический курс по внедрению редких для российского рынка инструментов SRE для повышения стабильности системы. В программу интенсивов вошли темы, которые принципиально отличают работу SRE-инженеров от практик DevOps.
SRE: Мега — это авторский курс от Senior Staff Engineer в Databricks Ивана Круглова. Ценность программы в том, чтобы внедрить инженерный подход к решению проблем с помощью продвинутых методов. Слепой перебор всех инструментов SRE может потратить дополнительное время и деньги. Мы сделали интенсивы, чтобы вы смогли разобраться в фишках SRE в тестовой среде и выбрать из них полезные именно для вашего бизнеса. Помимо практики вас ждут реальные кейсы по повышению стабильности от спикеров из российских и международных компаний.
Я не знаю, нужен ли SRE моему бизнесу
Site Reliability Engineering создан для того, чтобы инженеры перестали надеяться на чудо и всегда держали в рукаве план «Б» на случай инцидентов. Если надежность приложения — это то, что приносит доход, а вашим пользователям важен удобный доступ к сервису, то вы по адресу. Мы выделили следующие отрасли, где без SRE никак:
— финтех
— сервисы бронирования
— стриминговые платформы
— онлайн игры
— крупный ритейл
— каршеринг
— поисковики.
Собери свой конструктор
Мы выделили пять разделов, которые, по мнению наших экспертов, формируют в компании правильную культуру SRE.
Это курс-конструктор, где темы можно проходить по отдельности или сразу все вместе. Цена одного интенсива от 15 000 ₽, ну, а брать комплектом дешевле.
Что в программе:
1. Observability
Приложения уходят из монолита в микросервисы, поэтому нужно уметь агрегировать множество SLO/SLI в одну или несколько метрик. SRE-инженер должен грамотно оценивать бюджет ошибок и измерять надежность приложения.
2. Reliability architecture patterns
Паттерны того, как построить архитектуру надежной. SRE-инженер сделает так, чтобы система работала стабильно именно с точки зрения архитектуры.
— Exponential backoff & jitter
— Failovers & dummy server
— Graceful degradation (don«t let new functionality fail main one).
3. Proactive reliability testing
— Chaos Engineering
Обзор инструментов: Gremlin / ChaosMesh / ChaosBlade / ChaosKube / СhaosMonkey
Основные тесты: Slowness injection и Failure injection
Подготовка и планирование: формулирование целей и ожидаемого результата коммуникации, анализ данных.
— Capacity Planning
Load testing vs capacity testing
Виды capacity planning: Request mirroring/shadowing / Traffic amplification / Предсказания на основе исторических данных.
4. Intelligent delivery of changes
Не с точки зрения безопасности в плане взлома, а с точки зрения стабильности системы. Здесь подразумеваются практики разбиения больших изменений на много мелких, а именно методы правильного выкатывания этих изменений.
— Feature Flags
— Обзор продуктов — LaunchDarkly
— Флагов может быть очень много
— Как отслеживать
— Incremental rollouts
5. Incident management
SRE-инженер должен знать, как хендлить инцидент, как организовать дежурства в команде, выстраивать Shifts handovers, оформлять воркбуки и правильно вводить новичков в on-call.
Кому подойдет?
Тем, кто прошел базовый курс SRE;
Инженерам, которые хотят повысить отказоустойчивость системы и высвободить время на другие задачи;
Компаниям, которые уже внедрили SRE-практики, хотят усовершенствовать их применение и наладить внутренние процессы в команде.
Кто должен внедрять SRE?
Когда все рушится, в завале проблем первыми страдают инженеры. У руководства не всегда есть время самостоятельно разбираться в SLI, SLO и SLA, чтобы потом прийти с идеями внедрить SRE-инструменты.
Тут не помешает знать, как продать идею начальству и внедрить все с нуля. На бесплатном интенсиве по внедрению мы расскажем не про технологии, а именно про выстраивание процесса и его согласование.
Старт вебинаров: 22 сентября — 3 ноября 2022 г.
Занятия будут проходить вечером, поэтому можете прикоснуться к SRE практикам без отрыва от работы.
Оставить заявку для бесплатной консультации: https://slurm.club/3Dlyyr0