Слёрм DevOps. 3-ий день. ELK, ChatOps, SRE. И тайная молитва разработчика
Наступил третий и последний день первого, но не последнего Слёрма DevOps.
Мы не рассчитывали, что сможем повторить Слёрм DevOps. Но неожиданно для нас все спикеры согласились приехать на Слёрм в феврале, а фидбек показал, как именно доработать программу. Есть понимание, как сделать программу интенсива более целостной и детальной, а некоторые темы — более практичными. Так что в феврале мы собираемся провести Слёрм DevOps в Москве. Подробности будут ближе к декабрю. Анонс обязательно появится на Хабре.
6 сентября, на третий день Слёрма выступали четыре спикера.
Владимир Гурьянов, инженер/тимлид в Southbridge, выступление которого ещё на второй день Слёрма DevOps очень понравилось участникам интенсива. Владимир активный сторонник DevOps-подхода в работе, старается внедрять его повсеместно.
Павел Селиванов, признанная звезда Слёрмов, вдохновитель первого Слёрма по Kubernetes. О нём студенты писали, что «было бы здорово, если бы он вел всю программу». Павел является Certified Kubernetes Administrator. Обладает огромным практическим опытом внедрения Kubernetes — более 25 проектов в команде и индивидуально.
Эдуард Медведев, CTO в Tungsten Labs, разрабатывал и внедрял ChatOps при автоматизации дата-центров. После его выступления на Слёрме многие участники задумались о внедрении ChatOps в своих компаниях. Сейчас успешно выступает консультантом по безопасности.
Иван Круглов, Principal Developer в booking.com, настоящая приглашённая звезда конференции. Именно ради его выступления некоторые участники записывались на Слёрм DevOps. В Booking.com занимался такими инфраструктурными проектами, как распределенная доставка и обработка сообщений, BigData и web-stack, поиск. Сейчас в списке его задач построение внутреннего облака и Service Mesh.
Мы взяли обширные интервью у Эдуарда Медведева и Ивана Круглова — по готовности опубликуем на Хабре.
Аудитория всем своим задумчивым видом демонстрировала лёгкую усталость. Два предыдущих дня интенсива заставили поработать на пределе, головы требовали отдыха и выходных. Но темы и спикеры третьего дня разогнали усталость и дрёму. Особенно Site Reliability Engineering и Иван Круглов.
Под завершение второго дня Слёрма было принято решение перенести мониторинг инфраструктуры c Prometheus на завтра. Интенсив оказался слишком интенсивным — не все участники выдерживали темп.
И потому третий день начался с выступления Владимира Гурьянова. Он кратко рассказал, зачем собственно нужен мониторинг. Описал и классифицировал типы мониторинга. Затронул вопрос уведомлений в мониторинге.
Очень живо зашли в аудиторию темы «Как построить здоровую систему мониторинга» и «Человекочитаемые уведомления». Владимир завершил выступление темой Health Check, на что стоит обратить внимание и как обустроить автоматизацию на основание данных от мониторинга.
Чтобы расшевелить сонных участников и активировать у них способности к обучению на максимум, следом за Владимиром Гурьяновым вниманием публики завладел Павел Селиванов с темой «Логирование приложения с ELK». Он показал участникам Слёрма наши best practices логирования и рассмотрел ELK стек.
После первого кофебрейка, насыщенного общением и печеньками, участники Слёрма заняли места в аудитории.
Выступления Гурьянова, Селиванова и алкалоид пуринового ряда кофеин сделали своё коварное дело. Кофеин добрался до аденозиновых рецепторов мозга, заместил там пуриновый нуклеозид аденозин, отвечающий за процессы торможения — чем попросту лишил участников Слёрма шанса на «полениться» и «подремать». Не все поняли, что произошло. Зато все взбодрились.
Таким образом аудитория была на сто процентов готова к дальнейшему обучению и активному поглощению знаний. И к выступлению Эдуарда Медведева.
Эдуард выступил с темой автоматизации инфраструктуры с ChatOps, рассказал об интеграции мессенджеров с пайплайнами.
Финалом третьего дня Слёрма и Слёрма DevOps в целом стало выступление Ивана Круглова, Principal Developer в booking.com. Иван сразу же завладел вниманием аудитории, сознавшись, что у него в презентации более 140 слайдов, аккуратно тем самым намекнув, чтобы участники Слёрма не строили планов ни на саму пятницу, ни на выходные.
В интенсивном, длительном и глубоком выступлении Иван Круглов затронул тему DevOps и SRE, кто они друг другу, как соотносятся. Рассказал о «страшных терминах из мира SRE»: SLA, SLO, Error Budget и некоторых других.
Далее пошла практика и ещё больше практики — мониторинг SLI и SLO, применения Error Budget и управление прерываниями и операционной нагрузкой (apigateway, service mesh, circuit brackers). И ещё многое, многое другое.
Тайная молитва разработчика.
Так как тема SRE предельно обширна и рассказывать о нюансах можно хоть несколько дней, было решено, что в феврале на следующем Слёрме DevOps мы уделим ещё больше времени SRE и его практическому применению, как наиболее актуальной и востребованной технологии.
Sabbath, [6 сент. 2019 г., 18:25:30]:
Шикарный доклад!!
Я теперь думаю, что букинг по крутизне не уступают гуглу :)
aaa, [6 сент. 2019 г., 18:27:07]:
еще осталось UI\UX подтянуть
mr. Dmitry, [6 сент. 2019 г., 18:28:47]:
Ага, сколько докладов слышал от спецов букинга - все круто, все четко, все по уму. Но пользоваться из-за их гуя крайне сложно
После выступлений пришёл черёд многочисленных вопросов, как в офлайне, так и в рабочем чате Слёрм:
Владимир Гурьянов, [6 сент. 2019 г., 23:24:54]:
Спрашивали про мониторинг, сколько items у нас.
Не забыл, отвечаю.
Активных: 297 432
Maksim Aleksandrov, [7 сент. 2019 г., 0:11:58]:
Спасибо . Это какое количество проверок в секунду (nvps) ? И почему все таки prometheus ?
Владимир Гурьянов, [7 сент. 2019 г., 0:24:15]:
2.21K
Почему prometheus? Ну, хотя бы из-за service discovery и его удобной и гибкой настройки.
У zabbix плохо все в средах, где инстансы не долго живут и часто создаются новые.
С мониторингом docker и k8s у zabbix все тоже грустно.
Но для нас, пока + у прома не столько, что бы вкладывать время и силы в переезд с zabbix.
Участники Слёрма поделились впечатлениями:
Alexander B, [6 сент. 2019 г., 21:11:03]:
Спасибо за мероприятие, были "неровности", но для первого раза весьма достойно.
Темп в некоторых практиках напрягал, это интенсив во всех смыслах этого слова ) Чтобы уместить всё и не выкидывать во второй и третий день из докладов и практик материалы по причине нехватки времени - рассмотрите возможность четырехдневного слёрма.
Roman D, [6 сент. 2019 г., 20:49:05]:
спасибо, местами было интересно. В качестве пожелания на будущее - за пару дней до мероприятия посадите пару человек с улицы и заставьте их пройти практику по вашим инструкциям, исправите ошибки и неточности.
Никита Суворов, [6 сент. 2019 г., 20:49:30 (06.09.2019, 20:50:07)]:
Если пол пожелания, тоже есть - спикерам тренироваться перед зеркалом, слух режут эээ, уууу, ыыы между словами
Max Grechnev, [6 сент. 2019 г., 19:42:57]:
Спасибо! Курс получился отличный! Финал вообще огонь)
Smith Wesson, [6 сент. 2019 г., 19:58:11]:
Спасибо за курс! Вы лучшие!
Igor Averin, [6 сент. 2019 г., 19:58:12]:
Согласен! Было оч здорово! Спасибо организаторам!
После конференции мы попросили участников оставить отзывы в форме Google Docs. Результаты нас порадовали и воодушевили.
Спасибо всем, кто был с нами — в офлайне, в конференц-зале Selectel, и в онлайне. И спасибо огромное читателям Хабра. «Слёрм окрыляет!»©