Старт обновленного курса SRE: data-driven подход к управлению надёжностью систем

ede0138cd4d2770cd1b7f7389f54e292.png

С 6 по 27 декабря пройдет первый поток курса SRE: data-driven подход к управлению надёжностью систем. Вместо трехдневного интенсива вас ждут полноценные три недели обучения по сниженной цене и с большим количеством практики. Курс составлен по принципу полного погружения в среду, чтобы студенты не просто изучали теорию и смотрели видеоуроки, а могли сами потрогать различные инструменты и поработать в команде.

Как мы добились реалистичности? Мы создали собственное приложение по продаже билетов для кинотеатров, на котором участники интенсива в общей сумме больше 24 часов примеряют на себя роль SRE-инженеров и решают реальные задачи. Может показаться, что освоить инструменты SRE за три дня не получится. Для начала знать все необязательно, придя на интенсив вы поймете, какие практики нужны именно вашему бизнесу и как их успешно внедрить.

Как проходит практика

Наше приложение состоит из нескольких микросервисов. Оно агрегирует данные о сеансах, ценах и свободных местах со всех кинотеатров, показывает анонсы фильмов, дает выбрать кинотеатр, сеанс, зал и место, забронировать и оплатить билеты. Мы сформулируем показатели SLO, SLI, SLA для этого сайта, разработаем архитектуру, инфраструктуру, настроим мониторинг и алертинг.

Вам или вашей команде предстоит разобраться с несколькими кейсами. Например, произошла авария. Сервис обработки платежей лег. Как действовать, чтобы восстановить работоспособность в минимальные сроки? Нужно организовать работу группы по ликвидации аварии и научиться применять подходы к сайту с точки зрения SRE.

Формат предполагает разделение на команды, разбор интересных кейсов и обмен опытом между участниками и спикерами. На курсе будет фасилитатор, который наладит внутренние процессы в команде, распределит роли между участниками и поможет эффективно решать проблемы в режиме реального времени. 

На курсе вы

  • узнаете, как снизить ущерб от отказов в будущем;

  • внедрите правки прямо в прод;

  • узнаете, как решать конкретные проблемы, связанные с надежностью сервиса;

  • поймете, какие метрики собирать и как это делать правильно;

  • научитесь быстро поднимать продакшн силами команды.

Помимо того, что учиться будет интересно, благодаря новым знаниям и практике вы сможете:

  •  снизить процент отказов своего сервиса;

  • повысить скорость реагирования на отказы;

  • снизить риски при выкате новых фич;

  • увеличить скорость разработки.

Курс хорошо подходит как для только думающих внедрять в компании практики SRE, так и для сформировавшихся команд, которые хотят опробовать новые практики, улучшить имеющиеся и обменяться опытом с коллегами.

Почему наш курс?

Программа сформирована с участием SRE-инженеров из зарубежных и российских компаний, таких как: Google, Booking, Databricks, TangoMe, Яндекс, Ecommpay, Финам. С каждым практикумом программа дорабатывалась. Сейчас она не имеет аналогов на российском рынке за счет большого количества практики, экспертности спикеров и возможности внедрить инструменты SRE сразу в продакшн.

Вас ждут теория и AMA-cессии в течении недели, , а также субботние 4-часовые практики, чтобы спокойно погрузиться в профессию и потрогать инструменты.

Для команд от 5 человек у нас хорошие скидки, а для тех, кто оплачивает не от компании —рассрочка, и возможность вернуть 13% 

Количество мест ограниченно. Подать заявку и узнать подробности.

© Habrahabr.ru