[Перевод] ИИ учится определять проблемы со здоровьем человека по звуку его голоса14.11.2021 23:31

Голосовые биомаркеры — специфические параметры голоса человека. После «извлечения» их можно проанализировать, выявив те либо иные проблемы со здоровьем того человека, чей голос изучали. Алгоритмы машинного обучения дают возможность значительно увеличить эффективность такого способа определения заболеваний.

Давно уже известно, что изменения речи и ряда параметров голоса человека являются индикатором проблем со здоровьем. Речь идет о нейродегенеративных и легочных заболеваниях, сердечно-сосудистых расстройствах и проблемах с психикой. Пример — нарушение артикуляции или проблемы с произнесением гласных.

В некоторых случаях эти признаки настолько явные, что их без труда может обнаружить и распознать специалист. В других сделать это без помощи технологий крайне сложно, если вообще возможно. Но голосовые биомаркеры и искусственный интеллект способны изменить эту ситуацию.

Что касается самого понятия «биомаркер», то его Национальный институт здравоохранения США (NIH) определяет как «характеристику, которая объективно измеряется и оценивается как индикатор нормальных биологических процессов. Либо же патогенных процессов или фармакологических реакций на терапевтическое вмешательство». Так, биомаркеры крови являются индикатором рассеянного склероза. То же самое и с голосовыми биомаркерами — это такой же индикатор ряда заболеваний.

Можно выделить две основные категории параметров голоса, которые имеют значение для анализа «голосовых биомаркеров». В частности, параметры акустические — частота, амплитуда, тон, высота голоса. Есть и просодические параметры — длина произносимых гласных, темп речи, продолжительность пауз. Также можно использовать и некоторые лингвистические параметры.

Все эти параметры могут быть связаны с различными показателями состояния организма человека. И точно так же, как искусственный интеллект может поставить диагноз, интерпретируя медицинские изображения, алгоритмы малинного обучения в состоянии идентифицировать и классифицировать отклонения в ходе интерпретации голосовых биомаркеров. Этот способ позволяет быстро ставить предварительный диагноз, который впоследствии уточняет врач. Достоинство методики еще и в том, что она позволяет ускорить процесс диагностирования, а ее стоимость минимальна.

Многоступенчатый процесс анализа

Процесс извлечения и определения голосовых биомаркеров состоит из нескольких этапов. Во-первых, необходимо выбрать тип записи в самом начале процесса. Это может быть вербальная, гласно-слоговая или невербальная вокализация. Во-вторых, нужно собрать аудиоданные — для этого пациентов просят зачитать текст, рассказать что-то о себе, произнести несколько гласных или просто покашлять.

Аудиоданные записываются — по телефону или личном контакте с врачом. А затем анализируется. При этом программное обеспечение выполняет предварительную обработку звука, что включает в себя передискретизацию, уменьшение шума, кадрирование и т.п.

Следующий шаг — определение звуковых характеристик, которые используются для обучения нейросети. По словам авторов идеи, чем точнее обучение, тем эффективнее будет действовать ИИ в дальнейшем. Так, проблемы с гласными звуками характерна для болезни Паркинсона, а вот спонтанная речь — это уже признаки болезни Альцгеймера и/или расстройств психики.

И, конечно, COVID-19

Было бы странно, если бы подобная работа не давала возможность диагностировать COVID-19 и оценивать последствия перенесенного заболевания для пациента. В 2020 году ученые из разных стран активно изучали возможность обнаружения и мониторинга выявленного заболевания. И голосовые биомаркеры — одна из возможностей выполнять такую работу эффективно, причем без посещения врача. Достаточно лишь аудиозаписи голоса пациента и/или кашля, чтобы система могла выявить (или нет) заболевание.

Проект не является чем-то сверхсложным, да и сама идея лежит относительно на поверхности, поэтому занимаются реализацией ученые из разных университетов и стран, включая Кембридж, Институт здоровья Люксембурга, MIT и другие.

В США представители MIT занимались обнаружением признаков болезни Альцгеймера по записи голоса пациента. Отработав технологию еще до наступления пандемии, они смогли применить свою технологию для детекции COVID-19 у пациентов. Для этого в единую систему объединили несколько нейронных сетей.

Определение депрессии по голосу? Конечно!

Как говорится, не ковидом единым. Представители научно-исследовательских организаций разных стран давно занимаются изучением влияния депрессии на коммуникационные способности человека, включая речь. Стоит отметить, что диагностирование депрессии и более серьезных проблем с психикой — сложная задача даже для профессионала. По данным «The Lancet», правильный диагноз ставят лишь в 47,3% случаев.

Для того, чтобы решить эту проблему, компания Sonde Health разработала технологи, которая позволяет определить депрессию по образцу голоса пациента. Для этого нужен лишь смартфон и приложение. У пациентов, которые страдают депрессией, наблюдаются четкие признаки этой проблемы, и это как раз голосовые маркеры.

Более того, ряд симптомов депрессии, особенно у пожилых людей, является ранним признаком нейродегенеративных патологий.

Телемедицина набирает ход

Проникновение ИИ-технологий в медицину стимулирует развитие удаленной диагностики — когда пациенту не нужно идти в поликлинику для проверки состояния своего организма. Правда, пока что технологии, связанные с этим направлением, лишь развиваются, но можно ожидать, что в ближайшие несколько лет телемедицина станет вполне самостоятельной отраслью в здравоохранении.

Этому помогает повсеместное распространение интернета, мобильных устройств и разработка специализированных приложений и сервисов.