Лекарей сжигать нельзя беречь сейчас
TLDR: кому перестановки делают больнее — меряем свёрткой графов.
Выгорание на рабочем месте повстречал ещё в начале своей карьеры — и с тех пор живо интересуюсь этим вопросом. Представьте обстановку. Большой проект внедрения SAP. Высокие ставки. Амбициозные сроки. Нагрузку каждый воспринимал по-своему. Кто-то сорвался и самоустранился от выполнения обязанностей, кто-то стал токсичнее, у меня самого в какой-то момент чувство юмора пропало. Ненадолго.
Управление изменениями (дисциплина, направленная на снижение напряжения во время внедрения информационных систем) многим обязана медикам. Во-первых, сам феномен эмоционального выгорания впервые зафиксировали у медицинских работников. Во-вторых, первое масштабное исследование, обобщающее 68 кейсов масштабных перемен в английских госпиталях, открыло правила успеха для агентов изменения. Кроме того, моделирование эпидемий решает задачу максимизации влияния и позволяет внедрять нововведения быстрее и естественнее через (суб)оптимально выбранных людей на нужных местах.
Всё больше медучреждений перепрофилируют и это вызывает у работников ожидаемый стресс. Покажем, как его можно измерить, а уж где знаки препинания в заголовке ставить — решайте сами.
Эта заметка — продукт эскапизма. Сегодня Португалия начнёт размеренный выход из карантина, тягот которого толком и не заметил, хотя от монотонной обстановки и сидения в четырёх стенах стало подкукоживать в какой-то момент, да и счёт дням потерялся. В общем, просто период, когда порядок был разве что в уравнениях, да и то не у всех.
Предыстория. В начале марта Туту.ру поделились интересными данными (отдельное спасибо Milfgard), на которых мы построили модель развития ситуации (как оказалось впоследствии — самую продвинутую из ныне использующихся — метапопуляции — апплодисменты repushko и iggisv9t). Отошёл тогда от проверенных форм и выступил в жанре трёхмерной визуализации. Затем ещё был онлайн-воркшоп от университета Мериленда о сетевых методах в эпидемиологии да семинар по графам знаний из Стенфорда. Всё свободное время уходило на просмотр литературы и тестирование гипотез — отличный способ не читать новости. Именно благодаря участию в нескольких параллельных проектах и обмену идеями с достаточно широкой аудиторией, и появилась мысль рассказать о своём пет-проекте в новом свете.
По долгу службы временами доводится анализировать стейкхолдеров в проектах внедрения информационных систем. Об особенностях этой работы и методах анализа социальных структур писал и ранее.
Здесь рискну вызвать гнев профессиональных социологов и практикующих психологов, и получить упрёки за использование не самых современных теорий. В своё оправдание могу разве что сказать, что больше внимания уделяю вычислительным социальным наукам и из современных авторов слежу лишь за деятельностью Михала Косинского (того, чьи наработки по слухам использовала Cambridge Analytica для предполагаемого взлома демократических выборов), да его научного руководителя Юре Лесковека (и толпы его аспирантов).
Пирамида потребностей Маслоу — под ударом.
Диаграмма иерархии человеческих потребностей по Абрахаму Маслоу.
Ступени (снизу вверх):
- Физиологические
- Безопасность
- Любовь/Принадлежность к чему-либо
- Уважение
- Познание
- Эстетические
- Самоактуализация
Причём последние три уровня: «познание», «эстетические» и «самоактуализация» в общем случае называют «Потребностью в самовыражении» (Потребность в личностном росте)
Пирамида потребностей — общеупотребительное название иерархической модели потребностей человека, представляющей собой упрощённое изложение идей американского психолога Абрахама Маслоу. Пирамида потребностей отражает одну из самых популярных и известных теорий мотивации — теорию иерархии потребностей. Основная идея в том, что для перехода к потребностям более высокого уровня необходимо заполнить предыдущие уровни.
В ситуации с девочками-неврологами, отправленными в красную зону пострадают уровни со второго по пятый:
- Безопасность: хм…
- Принадлежность: уж послали так послали…
- Уважение: компетентность и признание — оставь на входе, достижение успеха — хм…
- Познание: знания и умения — сестринское дело, третий курс, понимание — здесь все более-менее в одной ситуации (всё ещё учимся бороться с заразой).
Следующая теория мотивации — двухфакторная модель Герцберга. В результате экспериментов на инженерах автор пришёл к выводу, что существуют две основные категории факторов оценки степени удовлетворённости от выполненной работы: факторы, удерживающие на работе, и факторы, мотивирующие к работе.
Факторы, удерживающие на работе (гигиенические факторы) — административная политика компании, условия труда, величина заработной платы, межличностные отношения с начальниками, коллегами, подчинёнными.
Факторы, мотивирующие к работе (мотиваторы) — достижения, признание заслуг, ответственность, возможности для карьерного роста.
Гигиенические факторы связаны со средой, в которой выполняется работа. По теории Герцберга, отсутствие или недостаток гигиенических факторов приводит к неудовлетворённости человека своей работой. Но, если они представлены в достаточном объёме, сами по себе они удовлетворения не вызывают и не способны мотивировать человека к нужным действиям.
Фото: съёмки сцены «худший туалет Шотландии» кинофильма «На игле» в явном виде показывающей глубину падения эстетических и гигиенических стандартов у лиц, употребляющих запрещённые препараты. Кажется, во взгляде Юэна МакГрегора читается гайдаевское «а может не надо?»
Вообще, различия во взглядах на вопросы эстетики и гигиены — первые источники культурного шока. Так, например, британцев повергают в ужас китайцы, для которых громко есть — значит высказывать восхищение кулинарным талантом шеф-повара. А всё дело-то в привычном протоколе взаимодействия — не зря ведь английский сервис (когда официант накладывает пищу на тарелку гостя на приставном столике — тележке на колёсах — и всякий раз меняет посуду и приборы, когда возникает потребность в добавке) является самым трудоёмким и предполагает наличие навыков повара у официанта, а порядок использования приборов — настолько мудрёный, что даже Её величество Елизавета II, Божией милостью Соединённого Королевства Великобритании и Северной Ирландии и иных своих царств и территорий королева, глава Содружества, защитница веры, при встрече с Гагариным сетовала на то, что сама постоянно путается во всех этих тонкостях.
Наконец, третья система взглядов, к которой обратимся — теория статуса.
В иерархических системах статус участников определяется их положением в цепочке командования и выполняемыми функциями. Известно, что карьерный рост может происходить в двух направлениях — вертикальном (управленческая ветка, связанная с административными задачами) и горизонтальном (та самая специализация и практика одного движения тысячи раз, как завещал Брюс Ли). Некоторые уникумы совмещают оба направления развития и строят так называемый Т-профиль. Например, среди инженеров в телекоме ходят легенды о директорах, умеющих работать с оборудованием в терминале.
Зена — королева воинов (Xena: Warrior Princess / Studios USA)
Известно, что у социальных животных с иерархической организацией групп социальный статус влияет на здоровье. Низкий социальный статус связан с хроническим стрессом, который, в свою очередь, вызывает нарушения работы самых разных систем организма. Так, на примере макак-резусов и макак-крабоедов было показано, что низкий социальный статус связан с нарушениями работы сердечно-сосудистой системы, эндокринной системы гипоталамус-гипофиз-надпочечники (которая регулирует множество процессов в организме, включая иммунные реакции, пищеварение и эмоции), воспалением и экспрессией генов в иммунных клетках.
Понижение статуса, вроде разжалования в рядовые — достаточно известная практика наказания, принимающая формы лишения почётных званий, запрета занимать определённые должности, либо заниматься специфической деятельностью — в общем-то один и тот же спровоцированный человеческой природой кортизоловый шок.
Эксперименты на мартышках показали, что этот эффект обратим: при повышении статуса иммунный ответ, подавленный у низкоранговых обезьян, снова возвращается к норме.
Кроме того, смена статуса — штука нелинейная и зависящая от обстоятельств. Так, например, уверенные в себе и находящиеся в верхней части пищевой цепочки топ-менеджеры легче проходят стресс-тесты в нормальных условиях и хуже — в условиях возможной потери статуса. Не зря в народе говорят — чем выше взлёт, тем больнее падение.
Собственно, случаи когда люди в корпоративной среде буквально слетали с катушек и пускались во все тяжкие из-за кажущегося или явного понижения статуса, или самой угрозы этому самому положению в обществе — и сподвигли меня к поискам инструментов, которыми вопрос можно измерить.
Рассмотрим современный подход к вопросу со стороны сообщества практиков управления организационными изменениями. Считается, что для того, чтобы контролировать ситуацию, её для начала нужно описать и хорошо бы выяснить ответы на следующий перечень вопросов.
Процессы и системы
Изменения в политиках, процессах, процедурах и отчётах. Не забываем про изменения технологии, инструментов, систем и средств автоматизации.
Люди и обучение
Потребности в навыках, управлении ресурсам, организационной готовности (все вот эти пакеты инструкций на случай наступления часа Ч), требуемых способностях, дополнительном обучении, оценке эффективности, компенсации и прочих плюшек за проявление новых желаемых моделей поведения.
Культура и привычки
Что нужно изменить в отношении кадров к происходящему, какие модели поведения нужно внедрить для достижения успеха, и что поменять в ценностях организации и корпоративной культуре.
Структура и управление
Изменения в ролях персонала и отношениях подотчётности, смена структуры организации. Изменение характера работы и смена физической локации.
Внешние и прочие факторы
Все внешние стейкхолдеры — клиенты, регуляторные органы, поставщики, общественные организации и прочие.
Масштаб перемен
Большой — нововведения фундаментально меняют то, как люди работают, взаимодействуют и ведут себя.
Средний — изменятся некоторые аспекты работы, взаимодействия и поведения.
Малый — незначительно поменяются детали работы, общения и поведения.
Время перемен
Обыкновенно масштаб хронологического планирования связан с существующими циклами планирования, принятыми в конкретной организации. Ориентиром обычно выступает бизнес-план или бюджет. Операционная деятельность может отслеживаться поквартально, полугодично, годично (порой встречается 18-месячный горизонт, смещающийся ежемесячно). Стратегии как правило рассматривают в с горизонтом в год, три, или пятилетку. Это — так, общие рекомендации.
Краткосрочно — перемены уже оказывают влияние на людей, либо же это произойдёт в ближайшее время.
Среднесрочно — влияние проявится в середине текущего периода планирования (отчётности).
Долгосрочно — результат появится к концу периода — ближе к границе горизонта планирования.
Вполне очевидно, что все эти рекомендации для конкретной ситуации можно представить в виде графа, в котором сущности представляются вершинами, а отношения — рёбрами. Представьте себе воображаемое медучреждение, в котором работают разноцветные медработники.
У них строгие инструкции и субординация — мне не приходит в голову пример более зарегулированной сферы человеческой деятельности.
Здесь стоит заметить, что медработники у нас разноцветные по нескольким причинам: во-первых, лекари действительно бывают различных цветов и форм; во-вторых вспомним про специализацию (которую, как и цветную картинку можно представить в виде вектора признаков); кроме того, вспомним о задаче раскрашивания графа (и алгоритме Вейсфейлера-Лемана, который здорово аппроксимируется графовой свёрточной нейросетью, о которой речь пойдёт далее).
Представьте, что процессы и структуру нужно изменить как-то так:
Также представьте, что мы сделали тот самый моральный выбор, обозначенный в заголовке и задались целью как-то облегчить участь наиболее травмированных переменами медработников. Хотя бы потому, что они хоть и простые солдаты, но довольно дорогие в подготовке, и их не так уж и много, и поэтому сберечь их может быть логичным шагом.
Забегая вперёд, скажу, что вполне достаточно выполнить нехитрое преобразование вида
$inline$H = \hat D ^{-½} \hat A \hat D^{-½} W^{(2)} \blacksquare \lgroup X, \doublecup \{\sigma[\hat D ^{-½} \hat A \hat D ^{-½} X W^{(1)} ]\} \rgroup, $inline$
Где:
— конкатенация,
— регуляризация обнулением случайно выбранных позиций — то самое 'забывание', запатентованное Google,
— нелинейная функция активации
— диагональная матрица степеней вершин (количество связей),
— диагональная матрица из единиц,
— матрица связности,
— матрица свойств вершин,
— веса слоя i нейросети, которые мы можем:
- выучить в режиме обучения с учителем;
- заполнить выбранными наугад значениями;
- выбросить (функция от этого станет чуть-чуть линейнее).
для графов, описывающих структуру связей в состояниях 'как было' и 'как стало', а затем измерить дистанцию между полученными векторными представлениями вершин — строками матрицы H. Вот так в одну строку записывается двухслойная графовая свёрточная нейронная сеть — модель, предложенная несколько лет назад аспирантом из Амстердама, которая наделала много шума и спровоцировала здоровый хайп, а также — оживление интереса к графам среди исследователей машинного обучения.
Разберёмся с ней, чтобы понять в чём суть и откуда берётся эта выразительность.
Но перед этим — о том, что за задачу мы решаем и почему именно графовые нейронные сети — лучший выбор из доступных инструментов машинного обучения.
«Все модели неверны, но некоторые полезны»
— Джордж Бокс
В анализе сетей есть класс задач, направленных на поиски подобия между вершинами. Исторически вопрос стоял в выделении самых важных (центральных) узлов, влияющих на поведение системы и процессы в ней. Известно, что в сетевых структурах характер связей — неслучаен и часто можно выделить группы, в рамках которых сущности будут связаны более тесно, чем с прочими сущностями в системе. Каждую из этих групп можно рассматривать как микрокосмос — собственно, лучшая из придуманных человечеством моделей распространения эпидемий — иерархическая модель метапопуляции — так и делает. Кроме того, связь между группами осуществляется через небольшое количество вершин, имеющих связи в различных сферах.
Иллюстрация сказанного выше (из статьи про алгоритм RolX) — в одной и той же сети контактов мы можем выделить «мосты» (красные ромбы слева), связывающие сообщества (разноцветные кластеры справа).
Мы будем решать задачу подобия структурных ролей. Собственно, подзадач будет несколько: определиться с методом анализа вершин, позволяющим эффективно описать их место в системе на локальном и глобальном уровнях; определиться с мерой дистанции для оценки подобия полученных представлений; определить меру дистанции, позволяющую рассуждать о масштабе индивидуальных перемен в результате трансформации структуры связей.
Почему именно эта задача. Все три упомянутых социологических теории — иерархии потребностей, гигиенических факторов, и статуса — вполне очевидно описываются гетерогенным графом (различные сущности связаны разнообразными связями). В общем-то все они с разных сторон рассматривают вопрос изменения структуры связей. Поэтому именно изменения структурных ролей вершин и их ближайшего окружения (настроение отдельных личностей всегда влияет на коллектив, и в первую очередь — на ближайших коллег) видятся наиболее адекватной моделью происходящих перемен.
Классический подход — алгоритм рекурсивного сбора информации об окружении — RolX. В каком-то смысле, этот алгоритм является предтечей графовой свёрточной сети.
Для каждой вершины мы определяем окружение — это может быть как выборка из непосредственных её связей, так и все контакты вообще. Затем признаки соседних вершин аггрегируются (это может быть сумма или усреднение значений) и конкатенируются с вектором признаков вершин. Таким образом, мы постепенно собираем информацию о контактах контактов и далее, каждый раз удваивая размер вектора свойств.
Кластеризация полученных таким образом векторов позволяет:
- Определить количество структурных ролей, и
- Группировать вершины по их роли в структуре.
Такой подход на практике решает задачу выделения групп стейкхолдеров, с которыми затем можно уже работать по-отдельности.
Добавим нелинейности и решим сразу две задачи: [1] избавимся от экспотециального роста размерности полученных векторов признаков и [2] повысим разрешающую способность модели. Первое грозит нам проклятьем размерности — в статистике есть эмпирическое правило: количество примеров, на которых мы обучаемся должно хотя бы в десять раз превосходить количество признаков, иначе провести границу между классами нелегко будет. Принимая во внимание небольшой размер графа (т.к. медучреждение — это сотни человек), мы просто можем оказаться в ситуации, когда прогон RolX на k = D шагов (на весь диаметр графа) приведёт к ситуации с размерностью вектора признаков, превышающей количество сущностей и классификатор будет считать все эти точки просто шумом, а в результате алгоритм кластеризации попросту захлебнётся неопределённостью. Но спасение есть.
Механику работы графовой свёрточной сети достаточно подробно расписывал здесь, поэтому (чтобы не заниматься самоцитированием) желающих врубиться в эмбеддинги графов отправлю читать ту простынь текста, а здесь приведу лишь краткое резюме.
Отличие от RolX заключается в том, что функция аггрегации информации о соседях — нелинейная и её параметры — общие. Такой функцией может быть в простейшем случае слой нейронов с нелинейной фунцией активации (ReLU, tanh (x), или же сигмоида — на практике первый вариант показывает очень хорошие результаты).
Одним из вариантов аггрегации является перемножение матриц: (модифицированной) связности (первые три матрицы — — симметрично нормализованный лапласиан), признаков вершин и весов слоя.
В общем случае аггрегатор может быть сколь угодно сложной ахитектурой (например U-Net или ещё какое чудо прогресса) — как свёрточной, так и рекурсивной (LSTM — всегда прекрасны), желательно — дифференцируемой (недавние эксперименты с недифференцируемым венгерским методом наводят на мысль, что нас в ближайшем будущем ожидают весёлые времена и прыжок в кроличью нору с непрозрачным моделями).
ФОТО: Тим Уолкер для календаря Pirelli, модель — Симона Мария Томпсон
Здесь впору вспомнить, что не одним только обратным распространением ошибки параметры подбирать можно, так что спокойствие, это дело житейское.
Почему без учителя? Здесь мне видится две причины делать так: [1] объективных данных о том, какие медучреждения справились лучше у нас ещё нет, [2] учреждения различаются и лучшее, что можно сделать сейчас — это [а] оценить масштаб трансформации на местах, и [б] определить похожие учреждения. Впрочем, ничто ведь не мешает впоследствии перейти к гибридной схеме и использовать полученные с помощью свёрток графов признаки для последующих задач машиного обучения. Здесь будет спойлер — именно так мы и поступили в соревновании Сбербанка, добавив топологических признаков в готовые модели — в некоторых случаях это привело к 10% улучшению метрики качества.
А есть ли альтернатива? Действительно, не одними свёртками можно померить форму графа. Первое поколение методов представления графов в векторном виде основывалось на случайных блужданиях (если что — вот достаточно детальный разбор). Мы запускаем бродягу по графу, маршруты посещённых вершин отправляем в word2vec (внезапно вспомнив о том, что частота образования связей чем-то похожа на частоту слов в человеческом языке) и получаем проекции в многомерном пространстве. При всей моей искренней любви к Free Lunch Theorem, вижу пару фундаментальных проблем на пути воплощения идеи в жизнь: [1] трансдуктивность — мы создаём представление только для присутствующих в графе вершин и всякий раз должны переучивать модель при изменении их состава. Кроме того, полученные вектора будут зависеть от инициализации и для разных структур (внезапно) потребуется их поворачивать и совмещать пространства признаков (как это, например придумали делать в Фейсбуке в очень крутом и когда-то революционном проекте MUSE). [2] Убедить руководителей в том, что кадровые вопросы эффективно решаются с помощью методов случайных блужданий представляется мне чем-то запредельным. И аргумент, что за работы в этом направлении недавно вручили премию Абеля (аналог Нобелевской, недоступной для математиков — просто потому что Нобель математиков невзлюбил) — скорее всего не прокатит. То же самое касается альтернативных методов, вроде вейвлетов. В общем, свёртки, свёртки, и ещё раз свёртки.
Почему графовая свёрточная сеть так круто работает? Всё просто — её разрешающая способность стремится к таковой теста изоморфизма Вейсфейлера-Лемана — алгоритма времён начала освоения космоса, интерес к которому пробудили эти самые свёртки графов. Элегантное доказательство схождения методов можно почитать здесь, а детальный разбор самого теста — здесь. Для ленивых вполне хватит утверждения о том, что данный метод позволяет определить различие между большинством встречающихся в реальном мире графов. Кстати, если вдруг у кого-то завалялся оригинал публикации Б.Ю. Вейсфейлер, А.А. Леман, Приведение графа к каноническому виду и возникающая при этом алгебра, буду признателен, если поделитесь — приятно читать классиков в оригинале.
Острие прогресса современной математики происходит в области биоинформатики, и новые архитектуры графовых свёрточных сетей обычно сначала применяют к вопросам взаимодействия веществ, будь-то протеины, экспрессия генов или ещё какая химия, а потом — переносят в соседние области. Впечатляюще выглядят видео моделирования поведения физических систем — мы можем обучить модель завихрениям потока, возникающим в одном водопадике, а затем — эффективно смоделировать поведение сложного каскада. Или решить более жизненную задачу и понять, как себя поведут разноцветные желейные бегемотики, если их поочерёдно сбрасывать в аквариум.
И прочие сложные ситуации, вроде песочных часов, кубика, перекатывающегося в ёмкости с шариками, и всего такого.
При чём здесь аналогия с физическими системами? Всё просто, порой собрать данные об особенностях персонала не представляется возможным и всё, что доступно для анализа — это лишь организационная структура и регламенты работы. В таком случае минимально жизнеспособная модель — соединённые пружинками грузики — уже выдаёт суждения, сравнимые с оценкой ситуации, которую сделает квалифицированный специалист по проведению организационных изменений.
По ряду причин выкладывать готовое решение в публичный доступ не готов.
Желающим разобраться со свёртками могу предложить позапускать вот этот блокнот на данных Туту.ру для соревнования Сбербанка, почитать статью Кипфа и вот этот детальный разбор метода на примере сети связей каратистов.
Но поскольку к медикам питаю тёплые чувства — образ жизни искателя приключений не раз приводил в отделение травматологии и можно сказать, что только благодаря их качественной работе сейчас пишу эти строки, то если это сообщение дойдёт до главврача, которому доводится переставлять кадры, либо до завотделения, чьи кадры переставляют, и их действительно заботят судьбы вверенных им в подчинение квалифицированных твёрдых рук, горячих сердец и холодных голов чуть больше, чем в телевизоре.
«Интерны» — российский комедийный телесериал-ситком, посвящённый работе врачей-интернов. Транслировался в эфире ТНТ
На всякий случай напомню бородатый анекдот:
Сидит психиатр (П) у себя в кабинете — скучает… пациенты не
идут. Тут тихонько так приоткрывается дверь и к нему на карачках
заползает человек (Ч) сжимая что-то в зубах, руках и т.д., плюс что-то
еще волочится сзади.
П: Ой кто это к нам тут ползет!!! Это наверное маленькая змейка. Заползай, змейка, заползай маленькая, доктор тебе поможет.
Человек отрицательно машет головой.
П: А-А-А. это наверное черепашка к нам в гости пожаловала. Заползай, черепашка, в кресло и расскажи дяде доктору что с тобой случилось…
Человек отрицательно машет головой.
П: Так кто же это у нас — наверное маленький червячок?
Ч: ДОКТОР, ИДИТЕ НА ФИГ, Я СИСАДМИН, ВАМ СЕТЬ
ПРОКЛАДЫВАЮ!!!
Но я всё ещё верю в чудо.
Фото: Её Королевское высочество принцесса София, герцогиня Вермландская, прошла 3-дневные интенсивные курсы подготовки и уже две недели как выполняет работу ассистента системы здравоохранения — чтобы разгрузить медиков.
Вернёмся к началу истории и тому первому опыту, когда впервые повидал полностью выгоревших, но всё ещё функционировавших кадров. Тяжелее всего тогда пришлось группе подготовки данных — сбор, очистка, и загрузка — всё это началось ещё до тестирования системы, к началу которого ребята подошли уже выжатыми. А тестирование — оно на то и тестирование, чтобы ошибки выявить, в том числе и в данных… Они оказались молодцами и вывезли большую часть запланированного, хотя в какой-то момент и вовсе перестали реагировать на раздражители — просто монотонно продолжая делать свою работу. Эффективность снижалась и в какой-то момент команду усилили крутым специалистом по миграции данных, а кроме того — их задачи стали раскидывать по менее выгоревшим сотрудникам функциональных команд. Нам тогда повезло — навалились, прорвались, в срок уложились.
А стоит ли уповать на авось сейчас?