Об использовании когнитивной системы IBM Watson Analytics для анализа данных о работе сердца
Сердце сделано из ткани,
которая очень легко разрывается и
очень легко починяется.
Александр Дюма-сын
Гаяне Арутюнян, архитектор аналитических систем для бизнеса, Клиентский центр IBM в Москве
Эта статья — практическая попытка понять насколько современные технологии могут помочь современной науке продвинуться вперёд, и быстрее решать проблемы связанные со здоровьем общества.
Сердечно сосудистые заболевания (ССЗ) являются одними из самых распространённых в нашей стране. По данным Росстата, причиной большинства смертей в январе—июне 2015 года стали болезни системы кровообращения (почти 50%, или 493,385 тыс. умерших). Молодые люди умирали в основном от сердечно-сосудистых заболеваний (почти 30% смертей).
На одной из конференций, посвященной вопросам медицины, я познакомилась с очень интересным человеком, учредителем компании CardioQVARK. Оказалось, что наши интересы сходятся в области анализа работы сердца. У него был большой фактический материал, обезличенные данные обследований пациентов — кардиограммы. У меня была возможность проанализировать эти данные при помощи аналитического инструментария IBM. Речь идет о так называемой когнитивной, то есть, умной аналитике — системах нового поколения для исследования больших объемов сложных, неструктурированных данных.
В их число входят продукты семейства IBM Watson. Именно облачный сервис Watson Analytics позволил оперативно проанализировать и визуализировать серии кардиограмм, предоставленные компанией CardioQVARK.
Для проведения эксперимента потребовались дополнительные ресурсы и мощности, которыми располагает Клиентский центр IBM в Москве, в котором я со своими коллегами и проводила анализ.
Сам эксперимент состоял из трех основных этапов: подготовка информации к анализу, собственно анализ и визуализация результатов, интерпретация результатов эксперимента.
Мы работали в тесном сотрудничестве со специалистами CardioQVARK, и нашей целью была достаточно амбициозная задача — получить значимые результаты после обработки больших массивов реальных медицинских данных.
Эта задача для больших объемов данных является весьма сложной. Прав был Блез Паскаль, когда говорил, что у сердца свои законы, которых «разум не знает».
Дело в том, что на работу сердца влияет огромное количество факторов, и понять, какие из них являются наиболее важными, весьма трудно. Врачи зачастую ориентируются на свой личный опыт, на интуицию. Мы же задействовали самые современные аналитические системы, способные увидеть связь между множеством разнообразных факторов и оценить их влияние.
Результаты анализа принесли много неожиданного. Начнем с того, что специалисты, которые давно работают по данной тематике, были удивлены, что команда ИТ-специалистов с высокой скоростью и точностью смогла разобрать и классифицировать состояние пациентов. Ведь мы не являемся специалистами в области медицины. Однако, когнитивные системы потому так и называются, что позволяют решать задачи, ранее доступные лишь экспертам, в обычном режиме.
Результаты оказались впечатляющими в первую очередь потому, что в автоматическом режиме удалось выявить большое количество важных зависимостей, выделить специфические группы пациентов, отклонения от нормы, выявить тех, кому требуется срочная операция, определить влияние медикаментов на ход болезни и многое другое.
Например, из общей массы удалось выделить и классифицировать:
• условно здоровых пациентов и характер их кардиограмм
• пациентов с нарушениями в работе сердца.
• пиковые периоды и нагрузки на сердце
• пациентов, кому требовалась операция на сердце
• пациентов, кто перенес операцию на сердце
• влияние медикаментов в послеоперационный период
• характер работы сердца в период восстановления
• возвращение сердца в нормальную работу
Более того, аналитический инструментарий Watson Analytics позволил увидеть интересные зависимости. Так, оказалось, что на работу сердца пациентов, особенно женщин, влияют фазы Луны. Это очень интересная зависимость потребовала отдельного анализа, ведь тема уже выходит за рамки традиционной медицины и поэтому требует особенно аккуратного подхода.
Несмотря на то, что влияние явлений космического масштаба — Солнца, Луны, на живые организмы исследуется уже достаточно давно, большая сложность выявления зависимостей пока оставляет это поле исследований достаточно проблематичным. Основы этих исследований заложил великий русский ученый А.Л. Чижевский. В частности, он открыл зависимость структуры крови от электрических и магнитных полей, в том числе солнечного электромагнитного поля. Не случайно, что электромагнитное поле сердца примерно в пять тысяч раз сильнее поля мозга.
Именно потому, что мы не являлись специалистами в медицине, была применена специальная методика для чистоты эксперимента и проверки результатов.
Мы получили обезличенные данные кардиограмм как здоровых пациентов, так и больных. То есть, при анализе наша команда не знала, какие кардиограммы относятся к больным пациентам, а какие сняты у здоровых людей.
Полученные результаты мы обсудили вместе с командой врачей. Взаимодействие двух команд было необходимым, потому что система CardioQVARK собирает огромное количество фактической информации о пациенте, и понимание многих из этих данных требует специальных знаний.
Статистические показатели, которые загружались в систему IBM Watson отражали разнообразные характеристики работы сердца — такие, как длительность сердечных циклов, их вариации, аритмию, связь с работой дыхания, частотой пульса и так далее.
Поскольку система CardioQVARK позволяет делать также спектральный анализ сердечного ритма, то есть определяет колебания — волны, возникающие при работе сердечных мышц. Эти данные также загружались в аналитический инструментарий Watson Analytics. В частности, это были параметры, связанные с дыхательными волнами, параметры медленных или средних волн, связанных с симпатической активностью или активностью, связанной с частотой сердечных сокращений, и многое другое.
Рис. 1. Благодаря приложению на iPad, врач — пользователь CardioQVARK в режиме онлайн контролирует состояние пациентов.
Итак, проведенный анализ позволил выявить целый ряд важных показателей и зависимостей:
• статистические значения, то есть средние величины для каждого из показателей
• периоды (циклов) работы сердца
• построение прогноза на неделю по каждому из параметров
• сопоставление значений с лунным календарём
• определение степени зависимости между показателями в пиковые периоды
Последняя зависимость особенно важна, поскольку пиковые периоды — это периоды критических режимов работы сердца, и они могут оказаться наиболее опасными для здоровья пациента.
Отдельно надо подчеркнуть, что инструментарий Watson Analytics позволил установить степень зависимости работы сердца от фаз Луны. Эта работа требует продолжения, и мы надеемся на интерес к ней со стороны медицины.
Конечно, большинство зависимостей могут быть рассчитаны и вручную, но главное в проделанной работе то, что подобные результаты могут быть получены моментально в автоматическом режиме и с визуальным отображением. Врач не тратит время на рутинный анализ данных, а сразу видит понятную картину, описывающую состояние пациента и может оперативно принимать решения.
Ведь чтобы оценить и понять, что происходило с пациентом потребуются лишь минуты. Врач-специалист сможет при этом оценивать целые серии кардиограмм, что даст более точную картину работы сердца пациента и позволит учитывать особенности этого пациента и его личную историю болезни. Кроме того, можно проследить состояние пациента не только в период его нахождения в стационаре, но и удалённо. Это позволит своевременно предупреждать о возможных отклонениях в состоянии здоровья и вовремя принять нужные меры.
Наше мнение разделяют и коллеги по эксперименту. Заместитель генерального директора CardioQVARK Сергей Садовский так прокомментировал итоги совместной работы: «В перспективе, применение анализа и машинного обучения на базе умных, экспертных систем, позволит врачу эффективно сортировать пациентов по степени тяжести состояния, диагностировать сердечные и некоторые внесердечные патологии, отслеживать значимые параметры организма. Уже сейчас это подтверждается на лабораторном уровне и в ходе добровольных клинических испытаний».
Проведенный эксперимент тем самым подтвердил, что применение современных технологий сможет значительно ускорить и повысить точность оценки состояния пациента.
Важно понимать, что весь эксперимент занял не более одной рабочей недели чистого времени. Это включало в себя первичную подготовку данных, статистический анализ и визуализацию при помощи Watson Analytics, интерпретацию результатов, а также консультации с медицинскими специалистами.
Использование когнитивных систем в медицине может значительно снизить стоимость лечения пациентов. Ведь если состояние пациента все время контролируется и вовремя принимаются нужные меры, средние показатели выздоровления оказываются гораздо лучше. И что является ещё более важным, можно приблизиться к решению задачи по оказанию персонифицированной помощи тем, кто в ней нуждается. От стандартного массового лечения к индивидуальному лечению с учетом всех особенностей каждого пациента — вот какой переход позволяет применение когнитивной аналитики Watson Analytics.