Язык языку рознь: идентификация человека по отпечатку его языка20.12.2023 11:15

Каждый человек по-своему уникален, несмотря на фундаментальные базовые сходства, обусловленные привязкой к одному биологическому виду. Цвет волос, оттенок глаз, рост, вес, и многое другое делает нас отличными от наших собратьев. Чаще всего, когда речь заходит об уникальных чертах человека, вспоминаются отпечатки пальцев. Ученые из Эдинбургского университета (Шотландия), использовав машинное обучение и 3D-визуализацию, установили, что уникальностью от человека к человеку обладает и его язык. Как именно ученые пришли к такому выводу, как им в этом помог ИИ, и какова польза от данного открытия? Ответы на эти вопросы мы найдем в докладе ученых.

Основа исследования

Язык представляет собой сложную гетерогенную анатомическую структуру, и его функционирование имеет основополагающее значение для речи, регуляции трения и переработки пищи в ротовой полости. Поверхность языка покрыта крошечными выступами, известными как сосочки, которые позволяют воспринимать вкус, текстуру и механику полости рта. Среди этих многочисленных анатомических выступов грибовидные сосочки считаются фенотипическими маркерами хемоощущения вкуса, поскольку в них расположены вкусовые рецепторы, тогда как нитевидные сосочки, лишенные вкусовых рецепторов, считаются регуляторами механорецепции восприятия текстуры. Считается, что у женщин больше грибовидных сосочков, и их чаще относят к супердегустаторам (люди с повышенным вкусоощущением). С другой стороны, было обнаружено, что увеличение количества сосочков связано с усилением восприятия жира.

Помимо вкусового восприятия, сосочки на языке отвечают за механоощущение. Механоощущение относится к способности ощущать текстуру, трение и прикосновение к поверхности языка и осуществляется в основном многочисленными нитевидными сосочками, которые действуют как тонкие датчики с усилением напряжения на поверхности языка. Эти сенсорные функции имеют решающее значение для манипулирования и транспортировки пищи и жидкостей во рту.

Такие текстурные свойства также влияют на нашу психологическую реакцию на еду. Например, ощущение сытости и, следовательно, голода зависит от восприятия трения и смазки. Недавно было показано, что наше предпочтение определенной пище обусловлено поверхностной смазкой, которую можно измерить с помощью искусственных поверхностей, похожих на языки.

Помимо пищевых предпочтений, растет интерес к пониманию сложной морфологии языка из-за его участия в различных возрастных заболеваниях полости рта, дегенерации слизистой оболочки и системных заболеваниях. Известно, что некоторые медицинские состояния и межиндивидуальные различия связаны именно с морфологией сосочков языка. Таким образом, понимание более тонких деталей морфологии и различий в структуре сосочков может привести к созданию новых биологических искусственных поверхностей в биомедицинской инженерии, пищевой инженерии и терапии.

Изображение №1

Сложную геометрию языка в микроскопическом масштабе можно оценить на 3D-сканах (снимки выше). Эти изображения получены путем реконструкции поверхности трехмерных оптических сканов силиконовой маски человеческого языка. Грибовидные сосочки (1b) крупнее, редко распределены по поверхности, имеют простую полусферическую форму. Средний диаметр грибовидных сосочков составляет около 878 мкм, и они хорошо видны на более крупных изображениях (1a). Нитевидные сосочки имеют более сложную форму короны (1c). Они меньше (около 355 мкм в диаметре) и существенно более многочисленны. По оценкам, на квадратный сантиметр поверхности человеческого языка приходится от 100 до 200 нитевидных сосочков.

Хотя были проведены значительные исследования важности плотности сосочков, понимание формы сосочков и свойств поверхности языка страдает от сложности извлечения и анализа геометрии сосочков в микроскопических масштабах.

В рассматриваемом нами сегодня труде ученые представляют первое в своем роде исследование трехмерной формы нитевидных и грибовидных сосочков у человека с акцентом на вариации микроскопической геометрии. Ученые разработали структуру, основанную на машинном обучении, применяемую к специально разработанным топологическим и геометрическим свойствам, называемым признаками, чтобы дать ответ на один фундаментальный вопрос: что отличает один тип сосочков от другого? Дополнительной целью исследования было выявления уникальности сосочков у разных людей.

Забегая вперед, можно сказать, что по сосочкам возрастную группу и пол человека можно предсказать с умеренной точностью, и даже конкретного человека из 15 участников можно идентифицировать с точностью примерно 48%. Это является первым доказательством того, что сосочки действуют как уникальный идентификатор, подобно отпечатку пальцев.

Результаты исследования

Аналитическая платформа обрабатывает данные, вычисляет характеристики, а затем применяет анализ на основе машинного обучения. Данные получают в виде цифровых 3D-сканов. Процесс начинается с изготовления масок дорсальной области языка участников исследования на силиконовых полимерах. Эти маски сканируются с помощью 3D-сканера, который дает набор 3D-точек. Затем эти точки проходят через алгоритм реконструкции поверхности, реализованный в Meshlab, который создает сетку и соответствующую поверхность (изображение №1).

Из этих данных сетки ученые извлекают сегменты, которые являются кандидатами на роль сосочков. Процесс экстракции заключается в следующем. Вокруг точки P на поверхности выбирается набор B точек в радиусе r + δ, где r = max (rfungiform, rfiliform) мкм и δ = 100 мкм. Плоскость, соответствующая B на основе алгоритма RANSAC, представляет собой лучшее приближение плоскости основания сегмента. Локальный максимум (m) в сегменте определяется как точка, наиболее удаленная от плоскости. Предполагается, что эта точка является вершиной сосочка, если он имеется. Наконец, вырезается область радиуса r вокруг m, представляющую сетку-кандидат на роль сосочка.

Изображение №2

На 2a и 2b показаны такие извлеченные сегменты грибовидного и нитевидного сосочка, а на 2c показана общая площадь поверхности без сосочка. Эти три вида элементов составляют основу данного исследования.

В общей сложности 2092 сегмента, извлеченные из сканов 15 участников, были вручную помечены как грибовидные, нитевидные или пустышки (т. е. те, где нет ни первых, ни вторых). В статистическом рабочем процессе случайное подмножество сегментов (называемое обучающим набором) используется для разработки статистических моделей, а оставшееся (тестовый набор) — метки которого неизвестны модели — используется для проверки точности моделей в задаче правильного прогнозирования класса метки (так называемая классификация). Анализ и машинное обучение проводятся по большому набору признаков.

В прошлой работе было обнаружено, что базовые характеристики высоты и радиуса различаются между типами сосочков. Более полный набор данных по сегментам и вычислительные модели улучшают эти базовые функции для достижения высокой точности автоматического определения типа сосочков и выполнения других задач.

Особенности можно рассматривать в разных масштабах. В глобальном масштабе отличительной особенностью может быть топологический инвариант всего сосочка. В локальном масштабе окрестности вокруг точки поверхности, геометрические свойства (в частности, кривизна точек окрестности) лучше всего характеризуют локальную форму поверхности. Локальные свойства можно агрегировать по всему сосочку, чтобы получить глобальный признак.

В этой работе топологические свойства вычислялись с помощью устойчивой гомологии. В этом подходе каждая вершина (точка на восстановленной поверхности) рассматривается как центр растущей сферы, а объединение этих сфер наблюдается при изменении топологии. Один из способов интерпретации вычислительной устойчивой гомологии состоит в том, что она отслеживает топологические особенности разных измерений по мере того, как они рождаются и умирают с ростом сфер.

На 2d–2i показаны постоянные топологические компоненты для трех типов сегментов, масштаб которых измеряется в мкм. На 2d–2f показано постоянное представление диаграммы, где каждый компонент проявляется в виде точки, индексированной по времени ее рождения и смерти. Разница в распределении точек на графиках позволяет предположить, что топологические особенности разных сегментов различаются.

На 2g–2i показан альтернативный вид тех же данных, называемый представлением штрих-кода, где каждый столбец показывает продолжительность жизни топологического компонента. Из этих наборов столбцов можно получить статистические характеристики, основанные на распределении длин столбцов и более сложных методах.

Распределение полос разной длины для H0 (компоненты связности) показано на 2j и 2k как оценки плотности ядра. Длина грибовидных стержней на графике 2j имеет более высокую плотность для более коротких стержней длиной от 0 до 10 по сравнению с нитевидными и пустышками (около 0.01). Такая же картина наблюдается и в среднем диапазоне между 17 и 25, где все плотности достигают своего максимума.

У грибовидных значительно меньше длинных полос по сравнению с нитевидными и пустышками, которые доминируют в конце спектра с более длинными полосами. На графике 2k с плотностью H1 отмечается, что плотность коротких полосок (длина от 0 до 10) выше у грибовидных (0.07), за которой следуют нитевидные (0.065) и пустышки (0.06). Таким образом, по-видимому, существует одна преобладающая область основных различий, в то время как H0 демонстрирует большую вариативность между типами.

Кривизна определялась локально в каждой точке и являлась полным дескриптором поверхности. Положительная кривизна возникает там, где поверхность соответствует области сферы, например, на вершине грибовидного сосочка. Острые пики характеризуются высокой положительной кривизной, тогда как пологие вершины, например, на вершине грибовидных сосочков, имеют меньшую положительную кривизну. Отрицательные кривизны наблюдаются в седловидных участках, например, вокруг основания сосочков.

В цифровых дискретных данных, где многообразия представляют собой триангулированные сетки, кривизна вычисляется в каждой вершине сетки как дефицит угла многообразия. Для данного анализа вычислялась кривизна на выборке точек сегмента. Геометрические характеристики сегмента включают такие величины, как максимальная и минимальная гауссова кривизна, процент точек с положительной и отрицательной гауссовой кривизной и другие агрегированные величины.

Распределение кривизны сегментов на 2a-2c показано на 2l. Видно, что для всех типов сосочков большинство точек сосредоточено вокруг малых значений кривизны, близких к нулю. В частности, грибовидные сосочки имеют больше точек почти нулевой кривизны, чего можно ожидать от грибовидных сосочков, имеющих в основном плоские или слегка изогнутые поверхности. Напротив, нитевидные участки поверхности имеют большую долю более острых точек кривизны.

Изображение №3

Различные особенности могут иметь разную степень важности для установления различий между сосочками. Важность признака является фундаментальным вопросом в области объяснимого машинного обучения и обычно определяется его вкладом в классификационную модель. Это довольно сложная мера, которую трудно получить, рассматривая функцию изолированно. Для целей исследования ученые использовали метод, называемый важностью признаков перестановки, и вычисляли вклад этих признаков в класс стандартных классификаторов, называемых SVM ядра.

Метод важности признака перестановки оценивает признак f путем обнуления f в тестовых данных и наблюдения за точностью классификации модели. Большое падение точности означает, что f является важным признаком модели классификатора. Эффект обнуления f достигается путем перестановки значений f среди точек тестовых данных.

На изображении №3 показаны три наиболее важные особенности при определении каждой из четырех интересующих меток: тип сосочков, пол, возраст и идентификатор участника. Основное наблюдение заключается в том, что определенные топологические особенности оказываются неизменно важными в этих задачах (3a-3d). Также было обнаружено, что топологические особенности в целом вносят больший вклад в точность прогноза, чем другие особенности (3e).

Изображение №4

Постоянная энтропия (0) (4a), максимальная гауссова кривизна (4b) и короткие полосы (1) (4c) — все это важные характеристики для определения пола участника. На 4a показано, что участники-женщины, как правило, имеют более высокое медианное значение максимальной гауссовой кривизны (которая справедлива как для грибовидной, так и для нитевидной формы) по сравнению с участниками-мужчинами. Это может быть связано с тем, что женские сосочки языка являются «более острыми».

Изображение №5

Топологические особенности также доминировали и в задаче прогнозирования возраста участников исследования. Постоянная энтропия (0) (5a), амплитуда (Image,0) (5b) и максимальная гауссова (5c) представляют собой наиболее важные особенности для задачи возрастной классификации. Базовые характеристики (высота, радиус) не были столь важными для этой задачи. Это позволяет предположить, что их характеристики не сильно различаются для двух возрастных групп в этом исследовании. Как и в задаче прогнозирования пола, функция максимальной гауссовой кривизны (5b) является одной из наиболее важных. Медиана для младшей возрастной группы составляет 0.269 (n = 840), а для старшей — 0.166 (n = 640), что подразумевает некоторую разницу между двумя группами: у младшей группы сосочки более «заостренные». Это наблюдение было справедливо как для грибовидных, так и для нитевидных сосочков.

Имея полное представление о том, что различия в строении сосочков языка указывают на пол и возраст человека, ученые приступили к задаче идентификации. В частности, ученые задались вопросом, содержат ли сосочки и признаки, рассмотренные выше, достаточную информацию для выполнения идентификации человека посредством простого статистического метода.

Таблица №1

Выше представлены результаты классификации биологического пола участников. Модели, обученные на топологических признаках, имеют точность 65%, превосходя характеристики кривизны на 5% и базовые признаки на 14%. Совместное использование всех признаков незначительно повышало точность до 67%.

Результаты прогнозирования возраста следуют той же схеме, что и задача прогнозирования пола. Топологические особенности сами по себе достигают точности классификации 0.73, за ними следует кривизна с 0.67. Базовые характеристики отстают почти на 0.10 с показателем 0.58. Использование всех признаков повышало точность до 0.75.

Далее ученые проверили, может ли их система идентифицировать человека по тем или иным признакам его языковых сосочков. Сбалансированная точность топологических признаков (39%) почти вдвое превышала точность кривизны (22%).

В отличие от двух предыдущих задач по полу и возрасту, здесь объединение всех признаков приводит к значительному улучшению сбалансированного показателя точности до 48%. Это позволяет предположить, что как локальная, так и глобальная информация может способствовать предсказанию личности участника.

Изображение №6

Разработанная модель машинного обучения может использоваться для точного обнаружения и позиционирования сосочков на сегментах языка одного человека. Выше показано, как метод точно позиционирует грибовидную форму (синий цвет) и нитевидную форму (желтый цвет) на сегменте языка одного участника. Таким образом, этот автоматизированный подход позволяет эффективно и точно создавать карты или отпечатки языка на основе заданных масок.

Для более детального ознакомления с нюансами исследования рекомендую заглянуть в доклад ученых и дополнительные материалы к нему.

Эпилог

В рассмотренном нами сегодня труде ученые уделили внимание языку человека, а именно сосочкам, которые его покрывают. Использование трехмерных снимков языка и машинного обучения показало, что поверхность языка человека является уникальной, как отпечатки пальцев.

В ходе обучения системе были предоставлены сканы более двух тысяч языковых сосочков, взятых из силиконовых слепков языка пятнадцати человек. Важную роль в обучение системы играла топология сосочков. В результате система могла определять тип сосочков с точностью около 85%, а также создавать карту положения нитевидных и грибовидных сосочков на поверхности языка.

Куда более важным стало открытие того, что у каждого из 15 испытуемых сосочки были уникальны. Система могла идентифицировать конкретного человека с точностью порядка 48%, используя при этом данные лишь об одном сосочке языка.

Авторы исследования планируют использовать свою методику для выявления микронных особенностей на других биологических поверхностях. Это может помочь в раннем обнаружении и диагностике необычных новообразований в тканях человека.

Немного рекламы

Спасибо, что остаётесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас, оформив заказ или порекомендовав знакомым, облачные VPS для разработчиков от $4.99, уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5–2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps от $19 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

Dell R730xd в 2 раза дешевле в дата-центре Maincubes Tier IV в Амстердаме? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5–2697v3 2.6GHz 14C 64GB DDR4 4×960GB SSD 1Gbps 100 ТВ от $199 в Нидерландах! Dell R420 — 2x E5–2430 2.2Ghz 6C 128GB DDR3 2×960GB SSD 1Gbps 100TB — от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5–2650 v4 стоимостью 9000 евро за копейки?