Слёрм DevOps. 3-ий день. ELK, ChatOps, SRE. И тайная молитва разработчика

Наступил третий и последний день первого, но не последнего Слёрма DevOps.

Мы не рассчитывали, что сможем повторить Слёрм DevOps. Но неожиданно для нас все спикеры согласились приехать на Слёрм в феврале, а фидбек показал, как именно доработать программу. Есть понимание, как сделать программу интенсива более целостной и детальной, а некоторые темы — более практичными. Так что в феврале мы собираемся провести Слёрм DevOps в Москве. Подробности будут ближе к декабрю. Анонс обязательно появится на Хабре.

wcsvndpxkrij_grakptmk0mnpmy.jpeg

6 сентября, на третий день Слёрма выступали четыре спикера.

Владимир Гурьянов, инженер/тимлид в Southbridge, выступление которого ещё на второй день Слёрма DevOps очень понравилось участникам интенсива. Владимир активный сторонник DevOps-подхода в работе, старается внедрять его повсеместно.

Павел Селиванов, признанная звезда Слёрмов, вдохновитель первого Слёрма по Kubernetes. О нём студенты писали, что «было бы здорово, если бы он вел всю программу». Павел является Certified Kubernetes Administrator. Обладает огромным практическим опытом внедрения Kubernetes — более 25 проектов в команде и индивидуально.

Эдуард Медведев, CTO в Tungsten Labs, разрабатывал и внедрял ChatOps при автоматизации дата-центров. После его выступления на Слёрме многие участники задумались о внедрении ChatOps в своих компаниях. Сейчас успешно выступает консультантом по безопасности.

Иван Круглов, Principal Developer в booking.com, настоящая приглашённая звезда конференции. Именно ради его выступления некоторые участники записывались на Слёрм DevOps. В Booking.com занимался такими инфраструктурными проектами, как распределенная доставка и обработка сообщений, BigData и web-stack, поиск. Сейчас в списке его задач построение внутреннего облака и Service Mesh.

Мы взяли обширные интервью у Эдуарда Медведева и Ивана Круглова — по готовности опубликуем на Хабре.

38n9kim1xz-ws7shvkabt9olpje.jpeg

Аудитория всем своим задумчивым видом демонстрировала лёгкую усталость. Два предыдущих дня интенсива заставили поработать на пределе, головы требовали отдыха и выходных. Но темы и спикеры третьего дня разогнали усталость и дрёму. Особенно Site Reliability Engineering и Иван Круглов.

Под завершение второго дня Слёрма было принято решение перенести мониторинг инфраструктуры c Prometheus на завтра. Интенсив оказался слишком интенсивным — не все участники выдерживали темп.

m9vi_znjdelrvsadv5a1iie1p94.jpeg

И потому третий день начался с выступления Владимира Гурьянова. Он кратко рассказал, зачем собственно нужен мониторинг. Описал и классифицировал типы мониторинга. Затронул вопрос уведомлений в мониторинге.

Очень живо зашли в аудиторию темы «Как построить здоровую систему мониторинга» и «Человекочитаемые уведомления». Владимир завершил выступление темой Health Check, на что стоит обратить внимание и как обустроить автоматизацию на основание данных от мониторинга.

blz1a_qnky5dpypnkpitapp26ve.jpeg

Чтобы расшевелить сонных участников и активировать у них способности к обучению на максимум, следом за Владимиром Гурьяновым вниманием публики завладел Павел Селиванов с темой «Логирование приложения с ELK». Он показал участникам Слёрма наши best practices логирования и рассмотрел ELK стек.

После первого кофебрейка, насыщенного общением и печеньками, участники Слёрма заняли места в аудитории.

Выступления Гурьянова, Селиванова и алкалоид пуринового ряда кофеин сделали своё коварное дело. Кофеин добрался до аденозиновых рецепторов мозга, заместил там пуриновый нуклеозид аденозин, отвечающий за процессы торможения — чем попросту лишил участников Слёрма шанса на «полениться» и «подремать». Не все поняли, что произошло. Зато все взбодрились.

Таким образом аудитория была на сто процентов готова к дальнейшему обучению и активному поглощению знаний. И к выступлению Эдуарда Медведева.

tolgigpvud5tnxenh3knxoquyba.jpeg

Эдуард выступил с темой автоматизации инфраструктуры с ChatOps, рассказал об интеграции мессенджеров с пайплайнами.

93thcj784dze_7t_-soui_g2rie.jpeg

Финалом третьего дня Слёрма и Слёрма DevOps в целом стало выступление Ивана Круглова, Principal Developer в booking.com. Иван сразу же завладел вниманием аудитории, сознавшись, что у него в презентации более 140 слайдов, аккуратно тем самым намекнув, чтобы участники Слёрма не строили планов ни на саму пятницу, ни на выходные.

wbmkg-wi2q-7xehluvafhtvtdjg.jpeg

В интенсивном, длительном и глубоком выступлении Иван Круглов затронул тему DevOps и SRE, кто они друг другу, как соотносятся. Рассказал о «страшных терминах из мира SRE»: SLA, SLO, Error Budget и некоторых других.

yhobtg3ng-qgqzesxxcqmtgkuno.jpeg

9ltushkj7gsvqt4gnneuk5bux3i.jpeg

Далее пошла практика и ещё больше практики — мониторинг SLI и SLO, применения Error Budget и управление прерываниями и операционной нагрузкой (apigateway, service mesh, circuit brackers). И ещё многое, многое другое.

s4b8g6vukq1sw8ajfpegzxpkyr0.jpeg

gz20c-omdcjzrsa9nzuyaxzt1d0.jpeg
Тайная молитва разработчика.

Так как тема SRE предельно обширна и рассказывать о нюансах можно хоть несколько дней, было решено, что в феврале на следующем Слёрме DevOps мы уделим ещё больше времени SRE и его практическому применению, как наиболее актуальной и востребованной технологии.

Sabbath, [6 сент. 2019 г., 18:25:30]:
Шикарный доклад!!
Я теперь думаю, что букинг по крутизне не уступают гуглу :)

aaa, [6 сент. 2019 г., 18:27:07]:
еще осталось UI\UX подтянуть

mr. Dmitry, [6 сент. 2019 г., 18:28:47]:
Ага, сколько докладов слышал от спецов букинга - все круто, все четко, все по уму. Но пользоваться из-за их гуя крайне сложно

После выступлений пришёл черёд многочисленных вопросов, как в офлайне, так и в рабочем чате Слёрм:

Владимир Гурьянов, [6 сент. 2019 г., 23:24:54]:
Спрашивали про мониторинг, сколько items у нас.
Не забыл, отвечаю.
Активных: 297 432

Maksim Aleksandrov, [7 сент. 2019 г., 0:11:58]:
Спасибо . Это какое количество проверок в секунду (nvps) ?  И почему все таки prometheus ?

Владимир Гурьянов, [7 сент. 2019 г., 0:24:15]:
2.21K 
Почему prometheus? Ну, хотя бы из-за service discovery и его удобной и гибкой настройки.
У zabbix плохо все в средах, где инстансы не долго живут и часто создаются новые.
С мониторингом docker и k8s у zabbix все тоже грустно.
Но для нас, пока + у прома не столько, что бы вкладывать время и силы в переезд с zabbix.

Участники Слёрма поделились впечатлениями:

Alexander B, [6 сент. 2019 г., 21:11:03]:
Спасибо за мероприятие, были "неровности", но для первого раза весьма достойно. 
Темп в некоторых практиках напрягал, это интенсив во всех смыслах этого слова ) Чтобы уместить всё и не выкидывать во второй и третий день из докладов и практик материалы по причине нехватки времени - рассмотрите возможность четырехдневного слёрма.


Roman D, [6 сент. 2019 г., 20:49:05]:
спасибо, местами было интересно. В качестве пожелания на будущее - за пару дней до мероприятия посадите пару человек с улицы и заставьте их пройти практику по вашим инструкциям, исправите ошибки и неточности.

Никита Суворов, [6 сент. 2019 г., 20:49:30 (06.09.2019, 20:50:07)]:
Если пол пожелания, тоже есть - спикерам тренироваться перед зеркалом, слух режут эээ, уууу, ыыы между словами

Max Grechnev, [6 сент. 2019 г., 19:42:57]:
Спасибо! Курс получился отличный! Финал вообще огонь)

Smith Wesson, [6 сент. 2019 г., 19:58:11]:
Спасибо за курс! Вы лучшие!

Igor Averin, [6 сент. 2019 г., 19:58:12]:
Согласен! Было оч здорово! Спасибо организаторам!

После конференции мы попросили участников оставить отзывы в форме Google Docs. Результаты нас порадовали и воодушевили.

81ukcbtmbol9wtqmtjjtotxivgo.png
5f-hpp1mokpxuyfhq6ooisbbbq0.png
thllalvd4_5hts6rx-zbazweg48.png

Спасибо всем, кто был с нами — в офлайне, в конференц-зале Selectel, и в онлайне. И спасибо огромное читателям Хабра. «Слёрм окрыляет!»©

© Habrahabr.ru