ИИ научили распознавать простуду по голосу
Симулировать болезнь скоро станет сложнее. Тайком отпроситься с работы, нервно кашляя по телефону своему начальнику, уже не получится — скоро компания сможет определить, настоящие ли у вас симптомы, просто по звуку вашего голоса.
Каждый, кто просыпался с насморком и голосом, как у Дарта Вейдера, может подтвердить, что заражение вирусом простуды изменяет звучание голоса. Это происходит потому, что голосовые связки воспаляются, и это изменяет их акустические свойства. Ткани временно отекают и вибрируют с более низким тоном.
Исследовательская группа из Национального технологического института имени Сардара Валлабхаи в Сурате, Индия, попыталась выяснить, чем именно «простуженный голос» отличается от здорового. В своём исследовании они использовали тот факт, что человеческая речь, как и любой музыкальный инструмент, не воспроизводит звуки одной частоты. Даже самые подготовленные певцы не могут воспроизвести чистые ноты на манер камертона. Доминирующие ноты в человеческом голосе сопровождаются рядом более высоких обертонов.
Вместе эти наборы нот складываются в математические схемы, гармоники, причём обертоны имеют частоты, кратные исходной ноте. Например, частота второй гармонической ноты в два раза выше частоты основной ноты и так далее. Амплитуда (то есть, громкость) этих гармоник в речи имеет тенденцию уменьшаться по мере продвижения по шкале частот. Группа исследователей под руководством Панкаджа Варуле, инженера-электронщика, предположила, что простуда может изменить процесс затухания волн.
Чтобы выяснить это, учёные использовали записи голосов 630 человек в Германии, 111 из которых страдали от простуды. Каждого из них попросили посчитать от одного до 40 и описать, чем они занимались в выходные. Они также читали вслух басню Эзопа «Северный ветер и солнце», которая с 1949 года является популярным текстом для фонетических исследований.
Разложив речь каждого человека на спектр составляющих её длин волн, исследователи смогли определить доминирующую частоту и гармоники в каждом случае. Затем они использовали алгоритмы машинного обучения для анализа взаимосвязей между амплитудами этих гармоник и обнаружили закономерности, позволяющие отличить простуженный голос от здорового. Результаты своей работы они описали в журнале Biomedical Signal Processing and Control.
Таким образом по речи можно диагностировать не только простуду. Другие учёные изучают, как различные состояния, от болезни Паркинсона и депрессии до рака головы и шеи, могут влиять на частотные характеристики голоса человека. Это часть более широкой программы медиков, психиатров и программистов по дистанционному обнаружению биомаркеров заболеваний в данных, собранных на основе того, как люди говорят, пишут и даже ходят.
Диагностику простуженного голоса, выполненную индийской командой, нельзя назвать надёжной на 100%. Результаты показывают, что она может правильно диагностировать простуду примерно в 70% случаев.