Как мы делаем интенсив по SRE для ИТ-специалистов
Как мы делаем интенсив по SRE для ИТ-специалистов
SRE — это особый подход к работе, который позволяет строить максимально надежные и стабильные информационные системы. Его суть — в совместной работе команды, особых подходах к повышению надежности и быстрой реакции на системные ошибки.
Меня зовут Стас, я продюссер курсов в Слёрме. Я начинал работу именно на интенсиве по SRE — сначала как фасилитатор, потом как менеджер, сейчас — просто как ведущий. Хочу рассказать, как мы делаем этот курс, с какими трудностями сталкивались и что делает наш интенсив уникальным на рынке.
Как возникла идея запуска интенсива
В 2016 году в США появился новый подход — SRE. Он вырос из DevOps и довольно быстро стал популярным: по нему вышли несколько книг, а на рынке стали появляться SRE-специалисты и вакансии, на которых их искали.
Но как и со всеми такими подходами, существовала одна проблема — люди не совсем понимали, что такое на самом деле SRE. Кто-то видел в этом просто набор технических навыков, кто-то наоборот, управленческую должность. Из-за этого все работало не так, как нужно — компаниям казалось, что подход SRE несостоятелен, хотя на самом деле конкретно его даже не пытались реализовать.
Проблема существовала и за рубежом, но в России она была куда масштабнее. Поэтому в какой-то момент в Слёрме решили, что с этой ситуацией надо что-то делать. Мы хотели, чтобы ИТ-команды в России начали работать по SRE, чтобы подход трактовался правильно и приносил пользу. Поэтому мы нашли людей, которые действительно в этом компетентны, вместе с ними составили программу и запустили интенсив.
Про что получился курс, который мы сделали
Мы выбрали формат интенсива потому, что студентов не нужно было учить новым технологиям. С нужными технологиями они, как работающие в IT, уже были знакомы. Нам важно было рассказать в теории и показать на практике особый подход к работе, а для этого плотного трехдневного обучения было вполне достаточно.
Целью этого обучения было построить «пожарную команду» — группу людей, которая экстренно поднимает систему после падений и предотвращает такие инциденты в будущем. Если на интенсив приходила готовая команда, мы хотели собрать ее прямо здесь. Если отдельные люди — показать, как потом собрать ее у себя в отделе.
Сам я пришел на курс как фасилитатор — это такой человек, который облегчает коммуникацию внутри группы, помогает людям, которые впервые друг друга увидели, нормально общаться и собраться в команду.
С той идеей мы собрали один поток, офлайновый. А потом еще три, уже онлайн, и сейчас готовимся запускать пятый. Пока полет нормальный =)
Как устроено обучение на интенсиве
Сейчас схема у нас примерно такая. Студенты записываются, и до начала интенсива мы рассылаем им все нужные ссылки и доступы. В первую очередь это ссылка на чаты, где происходит внутрикомандное общение. Плюс ссылка на конференцию Zoom, в которой кураторы рассказывают теорию и отвечают на вопросы. И доступы к репозиториям на GitLab, тоже по командам. Получается полноценное учебное окружение, которое во многом имитирует реальное рабочее.
Сначала студенты получают теорию: по технологиям, организационным процессам, лайфхакам. А потом начинается самое интересное — практика.
Мы сделали приложение, которое имитирует онлайн-кинотеатр. И в нем заранее заложены типичные архитектурные проблемы, которые команды анализируют и придумывают способы их обхода. Это имитация реального продакшена — если лепить «абы какие» заплатки, то будут появляться все новые и новые поломки, нарастая как снежный ком.
В конце каждого дня выделено время на «поговорить» — студенты могут задать кураторам вопросы. Как правило, они появляются именно после практики, и помогают эффективнее решать задачи на следующий день.
Раньше мы набирали команды несколько хаотично, и иногда получалось так, что люди работают в сфере ИТ, но не умеют программировать. Теперь решили проводить предварительный опрос и собирать команды так, чтобы там обязательно были программисты. Плюс добавили менторов — они не читают лекции, а помогают командам с техническими вопросами, в которых те забуксовали. Некоторые из спикеров и менторов — это выпускники прошлых потоков, которые уже отработали SRE на практике.
С какими трудностями мы сталкивались
Главная трудность — это раскачать студентов. Бывает, что фасилитатор говорит: «Я ребятам не нужен, они сами общаются, телефонами уже обменялись, планируют вместе работу менять». А бывает наоборот — команда никак не разговаривает друг с другом, им это просто неинтересно. Такое, к сожалению, случается — не у всех хватает софтскиллов, чтобы работать именно в команде.
Еще была интересная история. К нам пришел крупный заказчик и сказал, что все круто, но они работают не с MySQL (у нас все на ней), а с PostgreSQL, и было бы здорово заменить БД. Мы заменили, но не учли, что тогда один кейс теряет актуальность — на PostgreSQL все автоматически фиксится. Обнаружили это поздно, когда уже не могли поправить, так что кейсов в той программе обучения стало на один меньше. Не самая страшная ошибка, но теперь следим за такими вещами внимательнее.
Что студенты могут после обучения
Если человек приходит к нам один, самостоятельно, то после обучения он может у себя в компании внедрить подход SRE. Ну или не во всей компании, а хотя бы в своей команде.
У меня было несколько случаев на практике, когда на старте ребята приходят откровенно слабые и технически, и в плане общения —, а на третий день уже могут потушить практически любой «пожар». За этим очень здорово наблюдать.
Еще круто, когда компания отправляет на обучение сразу целую команду. Они за три дня срабатываются и потом сразу просто переносят этот опыт на боевые задачи. Поэтому я советую тем, кто хочет посетить этот интенсив, постараться «продать» у себя в компании обучение сразу всей команды. Это будет гораздо эффективнее.
Как поучаствовать в интенсиве по SRE бесплатно
9 июня 2022 в 19.00 (мск) пройдет вебинар по SRE, где мы
расскажем:
— Что такое SRE и с чем его едят, в чем ценность.
— Нужны ли эти внедрения вам и вашей компании, каких результатов можно достичь, а каких — нет.
— Поговорим про опыт внедрения SRE в компаниях участников прошлых интенсивов, обсудим показатели.
— Ответим на ваши вопросы и разыграем 5 бесплатных мест на интенсив.
А также скажем пару слов о самом интенсиве: почему он проходит именно в таком формате, в чем его уникальность и какие компетенции можно получить.
В результате вебинара
Инженеры, разработчики: поймут как этот интенсив встраивается в их карьерный путь, что важно для компании и менеджмента, и как продать идею внедрения SRE в своем отделе компании.
Представили компании: узнают какой профит получит компания, если отправит к нам на курс 2–3, 10 или 50 человек.
Зарегистрироваться на вебинар: https://slurm.club/3xchmPV
Про сам интенсив
SRE: data-driven подход к управлению надёжностью систем пройдет 17–19 июня.
Подробности: https://slurm.club/3tkfALw