Изучаем правдивость полиграфа

Думаю, большинство согласится, что без комментариев хабр был бы совсем другим: менее интересным и информативным. В них часто встречаются важные дополнения и уточнения, в них рассказывают интересные истории и, конечно, дискутируют (мы же не в парламенте, верно?). Иные дискуссии бывают интереснее, чем сами статьи. И вот совсем недавно это случилось снова: я увидел комментарий, с которым был не согласен. Моя реакция на такое обычно проста: поставить минус в карму и закрыть вкладку постараться высказать свою позицию и послушать аргументы оппонента. Я так поступил и в этом случае, но потом оказалось, что вопрос куда глубже, чем мне казалось из модификаторов«быстро» и «аргументировано» для ответа придётся выбирать один. Кроме того, может быть я вообще не прав? Словом, захотелось мне разобраться в вопросе.
Для тех, кто по ссылкам не ходит: обсуждение касалось детекторов лжи (также известных как полиграфы) и их работоспособности. В рамках публикации постараемся разобраться, что это за машины такие, как применяются и можно ли им верить. С этими целями поговорим, прежде всего, об ИИ:

Идея и история

Идея, в сущности, проста: правду говорить легко и приятно, а врать — нет. А когда человеку что-то неприятно, то он начинает часто дышать, покрываться потом, у него учащается сердцебиение и вообще глазки бегать начинают. На интуитивном уровне всё, вроде бы, просто, а раз так, то можно смело использовать в практике. Наверняка вы слышали истории про криминалистов тысячелетней (а то и больше!) давности вроде таких:

  • Человек набирает в рот сухой рис (в других вариантах — рисовую муку) и выслушивает обвинение. Если рис остался сухим, то виноват, собака: начал волноваться и из-за этого у него перестала выделяться слюна.

  • Человеку кладут горячее лезвие на язык. Если прилипло — ничего хорошего не жди. Принцип действия, видимо, такой же, как и в предыдущем примере.

  • Какое-то количество людей передаёт друг другу яйцо с хрупкой скорлупой и тот, кто виновен занервничает и раздавит его.

  • Подозреваемому называют слова в случайном порядке, а он стоит и тихонечко в гонг бьёт. Но как только он услышит слово, связанное с преступлением, то из-за нервов ударит в гонг сильнее: тут-то его и надо вязать.

  • Пробовали измерять пульс: если он частый, то человек врёт.

  • Тщательно вглядывались в лицо подозреваемого и искали признаки обмана.

И прочие истории, от которых веет горной прохладой. Звучит всё это хотя бы минимально обосновано, но докопаться до источника хотя бы одного из этих способов я так и не смог. Что на русском, что на английском, кажется, эти способы пересказывают по кругу.

Чуть менее очевидные способы определения лжи

Непосредственно к делу это не относится, но раз уж я всё равно это нашёл, то пусть будет тут.


Отдельно, наверное, стоит выделить ордалии — детекторы лжи родом из средневековья. Подозреваемым предлагалось сделать что-то простецкое: вытащить кольцо из кипящей воды, подержать в руке раскалённый металл или походить по раскалённым углям. И тут уж или человек остался невредим (божественные силы, ясное дело, помогут невиновному), или одно из двух. Суд поединком туда же: разве провидение позволит победить лгуну? Впрочем, иногда градус жести сбавляли, известно про ордалию хлебом и сыром: подозреваемого туго опоясывали какой-нибудь верёвкой в районе живота и он должен был съесть какое-то значительное количество (вы не поверите) хлеба и сыра. Ещё воду иногда пить заставляли. Самой гуманной, пожалуй, была ордалия чудом: достаточно было поцеловать крест или посетить могилу святого. Всякие сатаманы и нарконисты, понятное дело, на такое пойти не могли.

Такие вот следственные эксперименты в дружеской обстановке примерно

Такие вот следственные эксперименты в дружеской обстановке примерно


Ещё встретился способ родом из Индии: жрецы, смазывали хвосты нескольких ослов сажей и заводили в тёмное помещение. Подозреваемых убедительно просили войти туда и дернуть осла за хвост. Если осел ревел, то вина считалась подтверждённой. А если никаких звуков не было, но на выходе у человека руки были чисты фактически, то это означало, что грязны они метафорически: побоялся за хвосты дёргать!


В Риме есть плита, которая называется ни много, ни мало Bocca della Verità. В смысле «Уста Истины». По картинке, думаю, всё примерно понятно: надо сунуть туда руку и если всё хорошо, то всё хорошо. А если нет, то руку откусят, куда ж без этого. Сцена, которая это обыгрывает, есть в фильме «Римские каникулы». Говорят, хороший, но сам не смотрел, так что утвреждать не берусь.

Вот такая штука

Вот такая штука

А вот тут кому-то руку уже схарчили. Простите за спойлеры

А вот тут кому-то руку уже схарчили. Простите за спойлеры

Вавилоняне много чего придумали: делить круг на 360 градусов, а год на 12 месяцев, немного математики, часы. Пиво, что немаловажно. А ещё такой способ определить лжеца: считалось, что он смотрит в землю (это можно понять, окей) и выписывает круги большим пальцем ноги (видимо, какая-то культурная особенность).


Про всякие способы сорта «разрежем барана и по кишкам поймём что к чему» упоминать, наверное, излишне.

Словом, идея что тогда, что сейчас была примерно одной: в спокойном состоянии человек функционирует одним образом, а когда врёт — другим. И если различия между этими состояниями описать и зафиксировать, то можно понять, где тебе врут. Основываясь на этом ещё Ломброзо (не последний человек в криминалистике) предлагал, например, мерить давление. И даже вроде бы кого-то изобличил во лжи.
Какие проблемы тут можно усмотреть? Очевидных две.
Первая —, а правильно ли мы посчитали пульс, измерили давление и всё такое прочее? Достаточно ли точные и чувствительные у нас приборы?
Вторая —, а мало ли, почему осёл заревел у человека пульс участился? О чём это говорит-то?
Запомним их. Это всё, впрочем, была только присказка.

Что, как и зачем измеряет полиграф

Каких-то единых стандартов нет, но в среднем список датчиков примерно такой:

  • Пневмограф (регистратор дыхательных движений).

  • Измеритель давления.

  • Гальванометр для измерения проводимости кожи (читай — количества пота).

  • Сенсоры активности (что-то вроде подушек, которые кладутся под руки, ноги и, простите, зад). Их ещё называют «countermeasure detectors», то есть «датчик противодействия», что ли.

  • Иногда какие-то экзотические штуки типа плетизмографа (первый раз услышал о таком, честно сказать).

    Про всякую периферию типа микрофонов и экранов, куда все показатели выводятся я не говорю.

В собранном состоянии выглядит это всё примерно так

Да вы и сами в курсе, наверное

Да вы и сами в курсе, наверное

Сама процедура, опять же, усреднённо, выглядит так:

  • Сначала с человеком просто поболтают: расскажут про процедуру, сообщат список вопросов, которые будут заданы (тут, кстати, нет единого мнения: кто-то говорит, что надо выдать прям дословно все вопросы, кто-то считает, что достаточно сказать, мол, спрашивать будем как пропатчить KDE2 под FreeBSD о том и этом, конкретнее вам знать не надо.

  • На, эээ, испытуемого надевают всю эту сбрую и как-то задают какие-то вопросы для калибровки. Почему «как-то»? Я раньше думал, что их задают в обычном режиме, но в процессе исследования нашёл вот такое, например: «You«ll be asked questions in both an accusatory and non-accusatory manner to record your reactions to both approaches», то есть что-то вроде «Вам будут задавать вопросы в обвинительной и обычной манере, для того чтобы зарегистрировать вашу реакцию на них». Почему «какие-то»? Тут тоже какой-то однородности нет. Кто-то считает, что надо поболтать про что-то нейтральное типа хобби и пройтись по списку целевых вопросов в произвольной форме, кто-то просто гонит те же вопросы, что будут и на контрольном (д)опросе только, может быть, в другом порядке. Единообразие только в том, что вас спросят что-то заведомо известное, например, имя или там день недели для того, чтобы зафиксировать реакцию и по ней откалиброваться. А, ну ещё спросят про то, не болеет ли человек чем-нибудь, что несовместимо с тестированием: сердечно-сосудистые заболевания, например. Или эпилепсия.

  • После этого начинается, собственно, проверка. «После» следует понимать как «от нескольких десятков минут» до «нескольких недель» в зависимости от графика работы специально обученных людей и типа теста (об этом ниже). Так или иначе, испытуемому задают вопросы (интересующие и контрольные), ради точности — по несколько раз. Вопросы формулируются так, чтобы их можно было трактовать однозначно и ответить на них «да» или «нет».

  • Наконец, специально обученный человек смотрит в графики, которые нарисовало оборудование и делает какие-то выводы. Может задать дополнительные вопросы, если испытывает какие-то сомнения. Может рассказать о результатах, а может и нет, тут уж зависит от заказчика, как я понимаю. Вот, в общем-то, и всё. Количество времени, кстати, на активную часть процедуры тоже разнится, разброс порядочный: от тридцати минут до четырёх часов.

Про типы тестирования

Единой классификации типов, опять же, нет, но я в меру своего понимая, выявил примерно следующие:

  • (Д)опрос по конкретному поводу: не вы ли, Родион Романыч, убили-с? Задают вопросы по одной ситуации, другого не касаются.

  • Проверка перед приёмом на работу (об этом типе на хабре в основном и спорят, кстати): не воровали ли спирт, предназначенный для протирки оптической оси? А в резюме-то правду написали? Такого сорта вопросы.

  • Периодическая проверка: то же, что предыдущее, только для уже работников, а не соискателей на вакансию. Чтобы люди не расслаблялись, словом/

    Иногда отдельно выделяют проверки в банковской, например, сфере, на предмет следования процедурам и всякие уголовные истории, но это какая-то уже ненужная детализация, как мне кажется.

И вот мы дошли

к самому интересному: какая точность у всех этих процедур? Это у кого спросить.
Если спросить у полиграфологов, то точность просто запредельная, речь идёт о числах в районе 90%. Откуда берутся такие числа можно понять из этого мета-обзора, например. Я не большой знаток стастики, но не вчитываясь очень глубоко я каких-то явных подтасовок и умалчиваний не обнаружил. Впрочем, стоит помнить, что это исследование в известной степени ангажировано и критерией отбора статей для обзора можно было настроить так, чтобы туда попадало что надо. И не попадало что не надо. Что-то в духе фильма «Здесь курят».


Если спросить у кого-то другого, то числа найти гораздо сложнее. А вот сомнения — куда проще. В чём же дело?
Тут можно выделить сразу целый набор причин. Попробую перечислить их. Помните, как мы запоминали две очевидных проблемы? Пришло время вспомнить.

Точность приборов

С одной стороны современные технологии позволяют изготовить достаточно точные датчики, которые способны с разумной точностью измеряют параметры, которые мы посчитали существенными. С другой стороны не вполне ясен, порог за которым изменение параметра становится существенным: настроим слишком чувствительно и не найдём двух похожих реакций; настроим недостаточно чувствительно и получим результат, в котором все реакции, в сущности, одинаковы. В какой-то мере эта проблема решается калибровкой и количеством вопросов, но нельзя сказать, что абсолютно устраняется: всегда есть возможность ошибиться.

Каузальность

Тот самый вопрос о том, почему пульс-то участился. Кажется, вроде бы, очевидным, что наши мысли могут влиять на то, как мы себя чувствуем: попробуйте подумать о работе и у вас разу заболит голова подумайте о лимонах и у вас, скорее всего, в срочном порядке начнёт выделяться слюна (у меня, по крайней мере так). Но это ведь не означает, что абсолютно все люди реагируют на одни и те же мысли одинаково (люди, у которых от лимонов слюна не потекла могут отметиться в комментариях). И вот так вот запросто утверждать, что у всех, кто врёт, начинает чаще биться сердце или там пот выступает не вполне обосновано. Опять же, сама по себе проверка на полиграфе — ситуация чаще всего стрессовая (хотя бы потому что нетипичная). Частично эту проблему призвано устранить предварительное тестирование, но это вполне можно сравнить с репетицией выступления и самим выступлением: сколько бы не репетировал всё равно какое-то волнение останется. Словом, из изначального вопроса родилось сразу два возражения: «почему мы считаем, что все, говоря неправду, реагируют одинаково?» и «как отсечь естественное волнение от волнения при лжи?».

Соотношение реакций на контрольные и релевантные вопросы

Контрольные вопросы, напомню, это такие, ответы на которые известны заранее: «Какого цвета небо?» или там «Вы когда-нибудь лгали?». А релевантные — относящиеся к исследованию: «Не вы ли топором старушку-то?». И предполагается, что реакция на контрольные и релевантные вопросы отличается достаточно, чтобы понять, что на релевантном вы пытаетесь соврать. Но кажется довольно очевидным, что если вас подозревают в убийстве старушки, то, даже если вы невиновны, этот вопрос вызовет куда более яркую реакцию, чем вопрос о цвете неба.

Зонтичность термина

Всё это время, говоря о полиграфе я подразумевал комплекс датчиков, которые описывал в начале: все эти плетизмографы и прочее. Но вообще говоря под проверкой на полиграфе можно подразумевать довольно широкий круг активностей. Вон на хабре каких-то четырнадцать лет назад рассказывали про портативные детекторы лжи, которые ограничиваются измерениями проводимости кожи.

Слон в комнате

До этого мы особо не касались этого аспекта, но сам по себе полиграф как система из датчиков ничего не определяет. Результаты интерпретирует человек, который хмуря брови рассматривает графики. И решение о том, что тут вот вроде отклонения есть, но в норме, а тут — человек может что-то скрывать принимает тоже он. Я поискал какие-то данные про автоматические удовлетворители полиграфы и особо ничего не нашёл ни на русском, ни на английском. Только вот таких ребят.
А если нет возможности вычленить какой-то общий принцип работы, то я недоверчиво качаю головой. Может быть, впрочем, я не прав и это лобби полиграфологов, которые просто не хотят оставаться без работы.
Да, кстати, стоит сказать, что для того чтобы быть оператором полиграфа не обязательно иметь какое-то специальное медицинское или психологическое образование: достаточно пройти сколько-то месячное обучение.

Вместо выводов

К сожалению, чего-то однозначного сказать по итогам не могу. Отчасти потому что вижу противоречащие друг другу выводы из разумных, вроде бы, предпосылок, отчасти — потому что большинство исследований, которые я нашёл, проведены в каких-то бородатых годах полвека тому назад, а современных как-то особо и нет. Складывается впечатление, что научное общество то ли потеряло интерес к теме, то ли решило, что полученных когда-то результатов достаточно, чтобы сделать однозначные выводы. Наверное, стоит согласиться, что при проведении (д)опроса в идеальных условиях с помощью суперпрофессионалов каких-то статистически значимых показателей добиться вполне возможно. В реальности, однако, условия не всегда идеальны, а работают не всегда суперпрофессионалы. Помимо этого, проводящий исследование всегда оперирует вероятностями и никогда не говорит «да, это точно правдивый ответ» и «нет, это наверняка ложь». Так что касательно общего случая моё мнение скорее не изменилось: проверка на полиграфе примерно настолько достоверна, насколько и бросок игрального кубика.
Тут я не говорил про Олдрича Эймса (он-то в ЦРУ работал, наверняка знал секретные техники обмана полиграфа) и новые способы определения лжи с помощью искусственного интеллекта. Возможно, как-нибудь в свободное время изучу их и чего-нибудь напишу.
А пока — подписывайтесь на мой телеграм-канал голосуйте в опросе и пишите комментарии, если вы с написанным (не) согласны.

© Habrahabr.ru