Нейросеть, определяющая возраст по анализу крови, — разработки ученых Университета ИТМО
Ученые из лаборатории «Компьютерные технологии» Университета ИТМО в составе международной группы исследователей разработали систему Aging.AI — алгоритм определения возраста по результатам базового анализа крови.
В отличие от других разработок эта — более универсальная и точная.
В ходе исследования ученые анализировали наборы данных людей разных национальностей и показали, что такой подход обладает большей предсказательной точностью, нежели разработки, основывающиеся на данных людей, принадлежащих к одной популяции.
Подробнее об этом исследовании читайте в нашем материале.
Фото Aging.AI
Определение точного возраста: почему это важно
Определение биологического возраста — одно из перспективных направлений исследований, связанных с изучением старения. Информация о биологическом возрасте человека (который не всегда может совпадать с хронологическим, или, другими словами, «возрастом по паспорту») может использоваться в будущем при назначении лекарств или при принятии решения о том, сможет ли человек быть донором.
Британские исследователи, работающие в этой сфере, заявляют, что возможность оценить биологический возраст человека (и сопоставить его с хронологическим) может изменить не только медицину, но и другие индустрии — например, страхование, где возраст в ряде случаев является важным показателем скоринга.
Более простая, но тоже нетривиальная задача — поиск биомаркеров, которые позволяют оценить хронологический возраст. Такие биомаркеры, к примеру, могут быть полезным инструментом для оценки терапевтической эффективности препарата или процедуры, направленной на «замедление старения». Именно эта задача — определение хронологического возраста по простым и доступным биомаркерам — и стояла перед учеными Университета ИТМО.
Как проводилось исследование
Чтобы создать алгоритм, предсказывающий возраст по биомаркерам, ученые использовали технологии глубокого обучения. Глубокие нейронные сети (deep neural networks, DNN) были выбраны потому, что, по словам ученых, наиболее эффективно отслеживают скрытые характеристики и могут обучаться на сложных примерах многомерных данных.
Использование DNN позволило ученым отследить нелинейные зависимости между данными анализа крови и хронологическим возрастом пациента. В качестве входных данных для нейронных сетей использовались анонимные данные более 120 тысяч анализов крови пациентов из Канады, Южной Кореи и стран Восточной Европы. Чтобы оценить эффективность своего подхода, ученые сначала использовали три независимые нейронные сети — по одной для каждой популяции.
После этого ученые сравнили результаты их работы с работой нейронной сети, обучавшейся на смешанной выборке, составленной из данных трех датасетов. Все модели использовали 19 параметров стандартного анализа крови (альбумин, глюкоза, гемоглобин и т.д.), а также информацию о поле пациента. Нейросеть, обучавшаяся на смешанной выборке, также анализировала данные принадлежности к той или иной популяции.
«Распределение биомаркеров крови для определения возраста различается в каждой популяции. Мы создали нейронную сеть, которая нивелирует эти различия и может быть использована для любых популяций.При этом она ведет себя более стабильно и реже ошибается. Также мы выделили ключевые биомаркеры, которые больше других влияют на старение. Среди них — альбумин и глюкоза. Эти данные согласуются с тем, что раньше было известно об изменении этих показателей при старении».
— Кирилл Кочетов, один из разработчиков алгоритма
Чтобы оценить работу сетей и отследить их предсказательные возможности, исследователи использовали датасет Национальной программы проверки здоровья и питания (США) — ретроспективные данные лабораторных исследований и демографические данные за период с 1996 по 2016 годы.
Результаты исследования
Национальная принадлежность оказалась одним из наиболее значимых маркеров при оценке возраста — по словам ученых, это может являться следствием «различий в типах старения между разными популяциями».
Как и предполагали ученые, сети, обучавшиеся только на одном однородном датасете, предсказывали возраст людей из другой популяции намного хуже, чем сеть, обучавшаяся на комбинированных данных. В первом случае ошибка в оценке составляла до 10 лет, в то время как итоговый вариант нейронной сети определял возраст с погрешностью менее 6 лет.
Ученые также показали, что сети, обучавшиеся на одном датасете, предсказывают возраст людей той же национальности не лучше, чем нейросеть, обученная на«комбинированных» данных, — еще один аргумент в пользу последней.
Как отмечают ученые, каждый из составляющих анализа крови по отдельности не является точным биомаркером. Однако в случае комплексного анализа сочетание этих параметров позволяет относительно точно определить возраст человека. Подробный анализ полученных данных исследователи приводят в научной статье.
Еще один результат проведенной работы — онлайн-сервис для оценки возраста Aging.AI. Им может воспользоваться любой, у кого есть свежие результаты анализа крови.
Кстати, это не единственное исследование в области медицины, которое проводится при участии ученых и исследователей из Университета ИТМО. О том, какие еще разработки на стыке медицины и ИТ ведутся в Университете, мы рассказывали в этом материале.