Время есть отношение бытия к небытию. Немного слов про Time-to-event analysis

Всем доброго дня!

Некоторое время назад нами была написана обзорная статья о методах анализа данных, используемых при разработке инновационных лекарств, и теперь пришло время поподробнее остановиться на отдельных пунктах этой публикации.

Сегодня мы поговорим о таком подходе, как анализ выживаемости (survival analysis) или, как его еще называют, анализ времени до наступления события (time-to-event analysis, ТТЕ). Звучит немного зловеще; и действительно: лично я познакомилась с этой методикой, занимаясь оценкой эффекта различных видов терапии на выживаемость пациентов с онкологическими заболеваниями. Забегая вперед, скажу, что сфера применения ТТЕ значительно шире, поэтому ее понимание может пригодиться широкому кругу специалистов. Данная статья освящает наиболее базовые концепции TTE, однако в конце искушенный читатель найдет список более исчерпывающих трудов.

Особенности данных

Как нетрудно догадаться, нас интересует время до наступления какого-либо события — гибели или выздоровления пациента, обострения заболевания или же возникновения побочного явления на фоне лечения. Если выйти за рамки медицины, то в качестве объекта анализа может выступать время до поломки детали, выплаты кредита заемщиком или отказа клиента от услуг компании.

Казалось бы, мы рассматриваем непрерывную положительную величину — время, и, соответственно, можем воспользоваться стандартными регрессионными методами анализа подобных величин. Но у данных типа TTE есть одна особенность, и называется она «цензурирование» (censoring). В реальности мы далеко не всегда знаем точные времена события для всех субъектов в исследуемой группе: очень часто с пациентами вплоть до окончания исследования никаких событий не происходит, а их дальнейшая судьба неизвестна. Более того, люди могут выбывать из испытания до его окончания, например, из-за отмены терапии на фоне возникновения побочных эффектов.

Аналогичная ситуация наблюдается и в банковском деле: если заемщик исправно платит по кредиту, но кредит еще не выплачен до конца, понятно, что событие (невыплата кредита) не наступило в течение какого-то времени, но точный срок фактического погашения неизвестен. В таком случае мы говорим о цензурировании справа (правостороннее) — мы знаем лишь то, что время от начала исследования до наступления события больше определенной величины. Такой тип цензурирования встречается наиболее часто, однако в ряде случаев имеет место и цензурирование слева (левостороннее), которое, напротив, возникает в том случае, когда невозможно установить точное время начала события или сам факт наступления события до начала исследования. Например, сложностью анализа данных инфекционных исследований является отсутствие информации о времени заражения, ведь зачастую пациенты узнают о диагнозе лишь при возникновении симптомов, а инкубационный период может длиться годами. Также встречается и интервальное цензурирование, характерное для ситуаций, когда известно, что событие наступило в определенный интервал времени, например, между регулярными профосмотрами. Но когда именно оно произошло, никто не может сказать, и время события искусственно привязывается ко времени соответствующего осмотра или визита (например, факт прогрессии заболевания установили во время визита на втором месяце наблюдения).

Почему же так важно учитывать цензурирование? Может, просто нужно избавиться от «неинформативных» данных? Или стоит заменить цензурированные значения усредненным показателем? Представим, что мы проводим исследования нового лекарства от рака. Если оно действительно работает, значительная доля пациентов, получающих лечение, не умирает, пока длится наблюдение, и тогда мы сталкиваемся с интенсивным правосторонним цензурированием. В таком случае исключение информации о выживших людях приведет к заниженной оценке эффективности терапии.

Мы выяснили, что сведения о цензурировании важны наряду с информацией о времени реально произошедших событий. Таким образом, типичный датасет для TTE анализа будет содержать данные об идентификаторе пациента, времени и флаге события (например, 1 — цензурирование, 2 — непосредственно событие). Но, конечно же, мы хотим выявить факторы, влияющие на риск возникновения события, поэтому ожидаем наличие дополнительных столбцов, содержащих информацию о режиме терапии, характеристиках субъектов и других сопутствующих факторах.

Рисунок 1. А. Виды цензурирования данных выживаемости: 1. Отсутствие цензурирования, 2,3. Правостороннее, 4. Левостороннее, 5. Интервальное цензурирование; В. Пример датасета для анализа выживаемости.

Рисунок 1. А. Виды цензурирования данных выживаемости: 1. Отсутствие цензурирования, 2,3. Правостороннее, 4. Левостороннее, 5. Интервальное цензурирование; В. Пример датасета для анализа выживаемости.

Описательная статистика

Один из базовых методов ТТЕ анализа был разработан учениками известного статистика Джона Тьюки — Эдвардом Капланом и Полем Мейером и заключался в оценке функции выживаемости S (t), характеризующей вероятность наблюдения события позже определенного времени:

S(t)=Pr(T>t)» src=«https://habrastorage.org/getpro/habr/upload_files/1e1/0d1/886/1e10d18865348758504c1db47829dfb8.svg» /></p>

<p>где время исследуемого события T является случайной величиной. </p>

<p>В рамках данного подхода было предложено разбить общее время наблюдения на интервалы соразмерные с интенсивностью регистрируемых событий, и посчитать вероятность выживания в каждом из них. В таком случае выживаемость на момент времени t можно представить в виде произведения таких вероятностей: </p>

<p><img alt=

Где dj — число событий в момент, rj– число пациентов в исследовании в момент tj, с которыми не произошло событие. Благодаря своей простоте метод завоевал популярность среди онкологов: статья, вышедшая в 1958 году, была процитирована 65 437 раз, а визитной карточкой любого онкологического исследования стал график Каплана-Мейера (рис. 2).

Рисунок 2. Пример кривой Каплана-Майера со стратификацией по группе лечения. Выживаемость на фоне экспериментальной терапии выше по сравнению со стандартом лечения. Знаки (+) отражают цензурирование, серая область обозначает доверительный интервал, медианная выживаемость показана черным пунктиром. Таблица содержит информацию о количестве пациентов, оставшихся в исследовании в определенный период времени. Для расчетов использована R библиотека survival.

Рисунок 2. Пример кривой Каплана-Майера со стратификацией по группе лечения. Выживаемость на фоне экспериментальной терапии выше по сравнению со стандартом лечения. Знаки (+) отражают цензурирование, серая область обозначает доверительный интервал, медианная выживаемость показана черным пунктиром. Таблица содержит информацию о количестве пациентов, оставшихся в исследовании в определенный период времени. Для расчетов использована R библиотека survival.

При анализе данных важно выявить факторы, которые оказывают влияние на изучаемый показатель. Способна ли новая терапия улучшить выживаемость? Можем ли мы найти группу пациентов, у которых препарат особенно эффективен или, напротив, не работает вовсе? Какие заемщики задержат оплату по кредиту, и какие клиенты откажутся от услуг компании?

Как и при работе с любыми случайными величинами, мы можем использовать параметрические и непараметрические методы проверки нулевой гипотезы. Напомню, что простота последних связана с отсутствием необходимости размышлений о виде распределения величины (в нашем случае времени наступления события). К непараметрическим подходам, используемым в анализе выживаемости, относят логранк критерий Мантеля-Кокса, критерии Уилкоксона и Тарона-Вера.  

Проверка нулевой гипотезы важна, но будут ли различия значимы с практической точки зрения? В медицине есть такое понятие как «клиническая значимость» — если препарат увеличивает выживаемость пациента лишь на 5 дней при медианной выживаемости в один год, то рациональность его назначения будет вызывать вопросы, поэтому количественный аспект для нас также является существенным.

Поиск количественных взаимосвязей

Перейти к количественным оценкам межгрупповых различий в 1972 году предложил сэр Роберт Кокс (по совместительству, первооткрыватель той самой логистической регрессии, знакомой всем датасайентистам). Чтобы лучше понять суть его работы «Regression Models and Life-Tables», давайте немного вспомним статистику.

Как мы уже говорили, время до наступления события T является некоторой случайной величиной, для которой мы можем использовать такие понятия как кумулятивная функция распределения F (t) и функция плотности вероятности f (t). В нашем случае F (t) характеризует вероятность наступления события раньше определенного момента времени и по смыслу противоположна S (t), а f (t) позволяет оценить вероятность наступления события в заданный интервал времени. Используя эти величины, мы можем рассчитать функцию рисков h (t), характеризующую вероятность наступления события в определенный интервал времени при условии того, что оно ранее не произошло:

h(t)=\lim_{\Delta t\to\ 0}\ \frac{Pr(t\leq T+\Delta t|T>t)}{\Delta t}=\frac{f (t)}{S (t)}» src=«https://habrastorage.org/getpro/habr/upload_files/dd6/23e/670/dd623e6703eb8410576b3ab6b1521731.svg» /></p>

<p>В основе метода Кокса лежит допущение о том, что соотношение рисков в рассматриваемых группах остается постоянным во времени. В таком случае мы можем ввести некоторую базовую функцию h0(t), характеризующую общую динамику рисков в исследуемых группах, а межгрупповые различия задать с помощью коэффциента beta следующим образом: </p>

<p><img alt=

Параметр Х характеризует значение независимой переменной (ковариаты, предиктора или, как сейчас модно говорить, фичи), которая может быть категориальной (группа лечения, пол пациента) или непрерывной (показатели биомаркеров, размер опухоли), и влияет на риск возникновения события. Если мы рассмотрим соотношение рисков в таких исследуемых группах, то думать о виде h0(t) нет никакой необходимости. В данной постановке нас интересует лишь отношение рисков (HR — hazard ratio), диктуемое величинами beta, и поэтому метод Кокса является полупараметрическим:

HR=\frac{h_0(t)\times exp(\beta \times X_A)}{h_0(t)\times exp(\beta \times X_B)}=exp(\beta \times (X_A-X_B))

Стоит сказать, что немотря на популярность, метод Кокса не является универсальным, ведь  допущение о пропорциональности рисков работает далеко не всегда. Часто проверкой выполнимости данного допущения (например, при помощи анализа остатков Шонфельда) исследователи пренебрегают, что приводит к искаженным результатам.

Что же делать если метод Кокса нельзя использовать? Или если мы хотим заниматься не только описательной, но и предиктивной аналитикой (например, чтобы спрогнозировать исход длительного клинического испытания на основе накопленных промежуточных данных)? В таком случае можно использовать параметрический подход, предполагающий подбор оптимальной функции риска, обеспечивающей наиболее точную аппроксимацию данных. В самом простом случае данная функция может быть постоянна и равна некоторой величине lambda:

h(t)= \lambda

Тогда мы говорим об экспоненциальном распределении времени выживания T~exp (lambda), для которого функция выживаемости будет иметь следующий вид:

S(t)=exp(-\lambda \times t)

Помимо экспоненциального часто используются логнормальное распределение, а также распределение Вейбулла или Гомпертца (рис. 3).

Рисунок 3. Примеры графиков зависимости функций риска и выживаемости от времени для некоторых распределений, используемых в TTE.

Рисунок 3. Примеры графиков зависимости функций риска и выживаемости от времени для некоторых распределений, используемых в TTE.

Есть и более экзотические способы задания функции рисков, например, с помощью кусочно-полиномиальной функции, однако оставим их применение за рамками настоящей статьи.

Стоит сказать, что в случае использования параметрического подхода нам важно не только подобрать вид распределения, обеспечивающего наиболее точную аппроксимацию данных, но и учесть факторы, оказывающие влияние на те или иные его параметры. Не углубляясь в детали, скажу, что на этом этапе наша задача сводится к перебору различных моделей и выбору оптимальной из них на основе ряда критериев: информационного критерия Акаике, мере неопределенности оценок параметров и диагностических графиков (рис. 4).

Рисунок 4. Сопоставление рассчитанных при использовании параметрических моделей функций риска (показаны красным цветом) с кривыми Каплан-Мейера (показаны черным цветом); AIC - информационный критерий Акаике.Использование распределения Вейбулла обеспечивает более точное описание данных. Для анализа использована R библиотека flexsurvreg.

Рисунок 4. Сопоставление рассчитанных при использовании параметрических моделей функций риска (показаны красным цветом) с кривыми Каплан-Мейера (показаны черным цветом); AIC — информационный критерий Акаике.Использование распределения Вейбулла обеспечивает более точное описание данных. Для анализа использована R библиотека flexsurvreg.

Добавим сложности

Пока мы с вами рассматривали ситуации, в которых независимые величины, оказывающие влияние на показатели выживаемости, остаются постоянными в течение всего периода наблюдения. Однако в наши прогнозы могут вмешиваться самые разнообразные события: у пациента изменился размер опухоли, появились отдаленные метастазы, опухолевый очаг перестал отвечать на терапию, пришлось снизить дозу препарата, заемщик банка потерял работу и его доход упал, компания повысила стоимость оказания услуг и многое другое… В таком случае, при проведении анализа TTE данных важно учитывать динамические изменения соответствующих величин. Здесь на помощь аналитикам приходит так называемое совместное моделирование (Joint modeling). Joint модели состоят из двух компонентов, один из которых описывает динамику изменения какой-либо независимой величины (например, биомаркера), а второй связывает ее с функцией рисков:

h_i(t)=h_0(t) \times exp(\beta \times X + \alpha \times m(t))

Где alpha и beta — параметры, характеризующий эффект постоянных и меняющихся во времени величин на функцию риска, соответственно, а m (t) — функция, описывающая динамику изменения биомаркера/предиктора во времени (например, та же кусочно-полиномиальная функция).

Подобные модели часто используют в онкологии для изучения взаимосвязи между динамикой роста опухоли, измеряемой на начальных этапах клинических программ, и данными о выживаемости пациентов, собираемых в более масштабных исследованиях, необходимых для регистрации препаратов. В данном случае расчеты joint моделей позволяют принимать решение о целесообразности проведения длительных и дорогостоящих регистрационных исследований на основе более ранних клинических данных.

Рисунок 6. Пример использования Joint модели для прогноза выживаемости пациента в зависимости от накопленной информации о динамике размера целевых для анализа (таргетных) опухолевых очагов.

Рисунок 6. Пример использования Joint модели для прогноза выживаемости пациента в зависимости от накопленной информации о динамике размера целевых для анализа (таргетных) опухолевых очагов.

Что по софтам?

Существует ряд программ и пакетов, которые широко используются в медицинском научном сообществе для базовой статистической обработки данных, например, GraphPad Prism, SPSS или Statistica. Однако, для более продвинутого анализа и красивой визуализации я бы порекомендовала освоить программную среду R, в частности такие библиотеки как survreg, survival, survminer, flexsurv, JM. Существуют опции и для приверженцев Python (например, sksurv), однако в фармакологическом сообществе данный язык только набирает популярность.

Цена ошибки

В заключение приведу небольшую историю о том, как особенности TTE данных, популяций пациентов и применяемых аналитиками методов повлияли на судьбу двух препаратов и множества онкобольных. В 2008 году фармацевтический гигант Pfizer занимался изучением клинической активности терапии, стимулирующей противоопухолевый иммунитет. На тот момент направление было революционным и многообещающим, однако промежуточный анализ показал отсутствие значимой эффективности, и комитет по мониторингу данных предложил остановить исследование. 

В то же время компания Bristol Myers Squibb (BMS) работала над препаратом-конкурентом и получила схожие результаты, однако биостатистики BMS порекомендовали все же закончить клиническое испытание. Полученные результаты произвели фурор в научном мире — у небольшой части пациентов с множественными метастатическими поражениями была достигнута стойкая ремиссия, что считалось немыслимым на тот момент. Иммунотерапия получила мировое признание, а Джеймс Эллисон и Тасуку Хондзё, предложившие данный метод лечения, в 2018 году удостоились Нобелевской премии по медицине и физиологии.  

Впоследствии оказалось, что иммунная система распознает опухоль лишь у больных с определенными характеристиками злокачественных клеток, и целевое назначение препаратов значительно продлевает жизнь пациентов. Ошибка Pfizer заключалась в использовании стандартных критериев остановки исследования, основанных на базовых подходах к анализу выживаемости, не применимых при наличии двух разных субпопуляций пациентов (с иммуногенными и неиммуногенными типами опухолей). Из-за временной остановки клинической программы компания потеряла время, а препарат-конкурент Ипилимумаб вышел на рынок и ежегодно приносит компании BMS более 8 миллиардов долларов.

Список литературы

  1. Kaplan, E.L. and Meier, P. (1958). Nonparametric estimation from incomplete observations. J. Am. Statist. Assoc., 53, 457–481

  2. Lukas J A Stalpers & Edward L Kaplan (2018) Edward L. Kaplan and the Kaplan-Meier Survival Curve, BSHM Bulletin: Journal of the British Society for the History of Mathematics, 33:2, 109–135

  3. Cox, D.R. (1972), Regression Models and Life-Tables. Journal of the Royal Statistical Society: Series B (Methodological), 34: 187–202

  4. Cox DR and Oakes D (1984). Analysis of Survival Data. Chapman and Hall, New York

  5. Lawless JF (2003). Statistical Models and Methods for Lifetime Data. Wiley, New York

  6. Collett, D. (2015). Modelling survival data in medical research. CRC Press, Taylor & Francis Group

  7. Rizopoulos D (2012). Joint Models for Longitudinal and Time-to-Event Data With Applications in R. Chapman and Hall, New York

© Habrahabr.ru