Инженерная культура Росбанка: что это и какие у нее принципы. Часть 2

Привет! Меня зовут Кирилл Покладов, я ИТ-директор корпоративного, инвестиционного и депозитарного бизнеса в Росбанке. В прошлый раз я рассказал о некоторых принципах нашей инженерной культуры.

9b080bc8cf5d6d2a02782b8622082b46.png

Сегодня я продолжу знакомить вас с другими принципами, которые помогают совершенствовать процессы в быстро меняющемся мире ИТ. 

Думаю о том, как будет работать после меня

Мы активно делимся с командами знаниями о текущих решениях и уникальных компетенциях, чтобы избежать BUS-фактора. Создаем базу для изменений и развития, чтобы облегчить работу будущим поколениям разработчиков. На своем примере расскажу, как реализован этот принцип на практике.

Открыто рассказываю команде о наших решениях и решениях команды топ-менеджеров банка, объясняю, почему именно такое решение принято, на чем оно основано и какую пользу оно нам принесет. Встречаемся со смежными командами, минимум раз в квартал для общей синхронизации, рассказываем, что сделали и какие ближайшие планы, какое взаимовлияние есть между нами.

Также индивидуально работаем с нашими ключевыми сотрудниками, поддерживаем и развиваем их, при этом стараемся делать так, чтобы они развивали и других сотрудников, а не хранили все знания в себе. И конечно, команда документирует всю техническую информацию в Confluence, чтобы каждый сотрудник имел доступ к необходимым знаниям.

Есть только одна вещь, которая ценнее времени. Это твоя репутация. На эту главную ценность нельзя жалеть ни времени, ни сил. Поэтому оставляй после себя хороший код, понятную документацию, в общем делай так, чтобы тебя вспоминали только хорошими словами и мысленно благодарили.

Понимаю, зачем делаю

Ключевой принцип, определяющий направление и мотивацию каждого инженера в команде. Наши действия получают истинное значение, когда мы осознаем, какую проблему решаем и каким образом наши действия вносят вклад в общий успех. 

Если я не понимаю зачем что-то делаю, для чего, какую проблему решаю, то мне становится не интересно, я теряю смысл работы. Как вы понимаете, на выходе будет и результат соответствующий. Поэтому мегаважно понимать для чего ты что-то делаешь, надо чувствовать ценность своей работы. Не бойтесь уточнять цель и назначение задачи, которую ты делаешь. Это важно! В любой задаче.

Подробнее о реализации этого принципа на примере постанализа массовых сбоев расскажет Наталья Удальцова, главный ИТ-менеджер управления ИТ-процессов IM\REQ:

Проведение анализа инцидентов, которые могут оказать влияние на наших клиентов и в результате причинить банку как материальные, так и репутационные потери, имеет для нас высокий приоритет.

Эта деятельность несет ключевое значение для развития банка и поддержания удовлетворенности клиентов. Главная цель — обеспечить стабильность и качество сервиса, чтобы клиенты оставались довольны и ценили предоставляемые услуги.

Для детального разбора инцидентов мы нашли для себя топ‑практик, которые успешно внедрили в будни поддержки ИТ, чтобы следовать цели.

  • Традиционный еженедельный ритуал — ретроспектива по значимым сбоям. Здесь мы исследуем корневые причины, триггеры сбоев, проверяем наличие мониторингов и планируем действия, которые помогут избежать повторения. Чтобы встреча была эффективной, мы приглашаем не только ответственных за решение сбоя, но и представителей ситуационного центра, комитета внедрения изменений и другие потенциально заинтересованные команды. Расширенный состав участников помогает решать вопросы не длинными переписками, а здесь и сейчас. Для случаев, когда причина сбоя неизвестна или не устранена, мы переводим сбой в плоскость Problem Management

  • По критичным сбоям мы организуем Post mortem — подробный разбор хронологии инцидента с привлечением сотрудников, устраняющих сбой, руководителей ИТ и ситуационным центром. Здесь мы анализируем моменты, в которых мы могли сократить время решения, выявляем зоны роста, а также подчеркиваем для себя удачные практики, которые помогли в моменте. Данный инструмент в нашем банке существует как на уровне всего управления ИТ, так и внутри команд поддержки.

  • Мы регулярно мониторим статусы всех задач, поставленных на ретроспективе или при проведении Post mortem, а также организовываем Problem‑борды — встречи по задачам и проблемам, которые выполняются длительное время. Это помогает не просто проговорить, а реализовать ранее поставленные задачи.

Важно, что при использовании этих и других практик мы не замыкаемся внутри ИТ‑команд, а привлекаем бизнес и не боимся обратной связи. Именно в ней мы видим зоны роста и наиболее приоритетные моменты в развитии.

Не боюсь проблем, говорю открыто

Не ошибается тот, кто ничего не делает. Мы открыто признаем, что проблемы — это неизбежная часть нашей повседневной работы. Вместо того, чтобы прятать их под ковер, мы выбрали путь учиться на ошибках. Открытость и смелость в признании проблем — это ключевой фактор, который дарит команде бесценный опыт. Поверьте, это гораздо более зрелый и взрослый подход, нежели промолчать и надеяться, что само рассосется. Надежда — плохая стратегия.

На этом принципе базируется формат мероприятий F#ckUp Review в Росбанке. О нем расскажут директор департамента ИТ-поддержки пользователей и клиентов цифровых сервисов Александр Денисов и начальник управления поддержки приложений Максим Емельянов:

В рамках нашей гильдии администраторов мы проводим встречи, где детально разбираем причины свежих инцидентов. Мы стремились сделать это в формате трагикомедии, фарса и гротеска, чтобы не только подчеркнуть важность процесса и сделать его более запоминающимся, но и чтобы спикеры не чувствовали напряжения и в непринужденной форме рассказывали об ошибках.

Цель F#ckUp Review не только обсуждение произошедшего, но и извлечение системных выводов, которые могут быть полезны и для других команд. Мы стремимся делиться нашим опытом и помогать другим извлекать уроки из подобных ситуаций. И все это в неформальной обстановке.

Как пример, на одной из встреч F#ckUp Review, посвященной очередному нестандартному инциденту спикер строил рассказ, отвечая на вопросы:

  • Как мы ждали, опасались инцидента и словили его?  

  • Как мы уходили от регламентных бэкап-ресторов и в итоге получили инцидент?  

  • Как мы не успели выполнить работы, которые исключили бы инцидент?  

  • И что нас спасло в решении?

Выводы релевантные для многих команд: тюнинг мониторинга, непрерывность контракта вендорской поддержки, а регламентные работы потому и регламентные, что их нужно делать вовремя.

Как работает инженерная культура?

Инженерная культура актуальна не только для тех, кто напрямую занимается разработкой. Ценности инженерной культуры применимы в любой области, будь то разработка, тестирование, администрирование или управление проектами. Они предоставляют общую основу, которая помогает формировать единую команду, работающую на общий результат. 

Инженерная культура Росбанка — это не статичный кодекс, а живой организм, поддающийся эволюции. Ценности, которые сегодня кажутся нам ключевыми, могут подвергнуться изменениям в будущем в соответствии с новыми вызовами, технологическими тенденциями и нашим собственным опытом. 

Важно также помнить, что без должного управления она может стать стихийной и неэффективной, упуская важные возможности и игнорируя потенциальные проблемы. Поэтому необходимо создавать благоприятные условия для развития культуры, включая установление стандартов, обучение персонала и внимание к обратной связи, чтобы она стала источником конкурентного преимущества и обеспечивала развитие.

Буду рад обсудить с вами, какие внутренние процессы увеличивают эффективность разработки в вашей компании. Welcome☺

© Habrahabr.ru