[Перевод] Детектор лжи 2.0. AI против человеческой хитрости
Привет, на связи Шерпа Роботикс. Сегодня мы перевели для вас публикацию Джессики Хамзелоу, автора статей по биомедицине и биотехнологии MIT Technology Review.
Умеете ли вы распознавать ложь? Этот вопрос, наверное, волнует многих после каждых политических дебатов. Исследования показывают, что люди, не очень хорошо справляются с этой задачей. Но что, если нам поможет искусственный интеллект? Новая технология обещает нам большую точность, чем старые методы, таких как полиграф.
Системы распознавания лжи на базе ИИ могут помочь нам отделить правду от ложных новостей, оценить достоверность заявлений, а возможно, даже выявлять неправду в резюме на работу. Но доверяем ли мы им? И стоит ли?
В недавнем исследовании Алиция фон Шенк и ее коллеги разработали инструмент, который значительно лучше людей в распознавании лжи.
Что произошло? Исследователи провели эксперимент, где люди писали о своих планах на выходные. Половине участников платили за ложь — за вероятное, но неправдивое утверждение. В результате было собрано 1536 утверждений от 768 человек.
Выводы исследования, опубликованного в журнале iScience
• Инструмент на базе ИИ действительно эффективен в выявлении лжи.
• Люди, использующие его, становятся лучше в распознавании лжи, но также чаще обвиняют других в обмане.
Рассмотрим как работает AI-детектор лжи.
Исследователи использовали 80% собранных утверждений, чтобы обучить алгоритм на базе языковой модели BERT от Google. Затем они проверили работу алгоритма на оставшихся 20% утверждений и обнаружили, что он может угадать правду или ложь в 67% случаев. Это значительно лучше, чем среднестатистический человек, который угадывает правильно около половины времени.
Что произошло, когда ученые дали людям возможность использовать AI-детектор лжи?
Только треть участников решили воспользоваться им, вероятно, из-за скептицизма к технологии или чрезмерной уверенности в собственных способностях распознавать ложь. Но те, кто все же решил довериться AI, практически всегда следовали его прогнозам.
Как это влияет на наше поведение?
Обычно мы предполагаем, что люди говорят правду. В этом исследовании участники знали, что половина утверждений ложные, но только 19% их так оценили. Когда же люди использовали AI-детектор, число обвинений в лжи подскочило до 58%. С одной стороны, это хорошо, такие инструменты могут помочь нам выявлять ложь, например, в ложных новостях в социальных сетях.Но с другой стороны, это может подрывать доверие, основополагающий аспект человеческого поведения, который помогает нам строить отношения. Допустим, что цена за точность суждений — разрушение социальных связей, стоит ли она того?
Рассмотрим вопросы точности.
В исследовании ученые стремились создать инструмент, который бы превосходил людей в распознавании лжи. Это не так сложно, учитывая, насколько плохо мы с этим справляемся. Но что, если такой инструмент будет использоваться для оценки правдивости постов в социальных сетях или проверки резюме кандидатов на работу? В таких случаях недостаточно, чтобы технология была «лучше человека».
Как нам реагировать на приблизительную точность?
Готовы ли мы принять точность на уровне 80%, где только четыре из пяти проверенных утверждений будут оценены правильно? А что про 99% точность? И не забывайте про прошлые ошибки в области детекторов лжи.
Полиграф был разработан для измерения частоты сердечных сокращений и других признаков «возбуждения», поскольку считалось, что некоторые признаки стресса уникальны для лжецов, но это не так. Результаты полиграфа часто не допускаются в судебных процессах в США. Несмотря на это, полиграф продолжает использоваться в некоторых ситуациях и приносит вред, когда его применяют для обвинений в реалити-шоу.
AI-инструменты в будущем могут оказать большое влияние на процесс проверки на детекторе лжи, поскольку их легко масштабировать.
Важно понимать, что полиграф можно использовать только для определенного количества людей в день. Но AI-детектор лжи потенциально может быть применен к огромному количеству людей и данных.
AI-инструменты могут быть полезными в борьбе с ложными новостями и дезинформацией, но их нужно тщательно проверять. Если AI-детектор лжи генерирует слишком много ложных обвинений, возможно, лучше его вообще не использовать.
Комментарий Sherpa Robotics
Согласно исследованию Superjob, рекрутеры все чаще считают применение полиграфа при приеме на работу неэффективным, а соискатели все реже соглашаются проходить собеседования с таким методом проверки.
Доля российских компаний, применяющих детектор лжи, остается небольшой: для всех сотрудников его используют в 2% организаций, а только для определенных позиций при найме — в 8%. За 2021–2022 года количество работодателей, выступающих против использования полиграфа, выросло: 56% не считают целесообразным применение детектора лжи при приеме на работу, а в 2020-м таких было 47%.
Но уже в 2023 году в международной издательской группе Nature была опубликована статья сотрудников Сбера. Публикация в научном журнале Scientific Reports (входит в группу журналов Nature Portfolio) посвящена разработке инструмента автоматизированной «детекции лжи». Исследователям банка удалось создать систему AI-рецензирования результатов проверок на полиграфе («детекторе лжи»). Теперь искусственный интеллект способен обрабатывать данные полиграфа, заключения специалистов и предлагать свое мнение. Согласно данным команды исследователей Сбера, им удалось создать первый в мире прототип такого инструмента для поддержки полиграфолога.
Разработанное AI-решение уже применяется в банке и проходит процедуру патентования.
*Читать новость о достижениях команды исследователей Сбера: https://lenta.ru/news/2023/04/17/al/
Высока вероятность, что в ближайшие годы популярность проверок на полиграфе в связке с искусственным интеллектом значительно возрастет. Но, учитывая высокую вероятность возникновения ошибок, оправданно ли это?
Приходилось ли вам проходить проверку детектора лжи? Расскажите о своем опыте. Как думаете, искусственный интеллект реально сделает такие проверки более распространенными? Станут ли работодатели больше доверять ИИ в ущерб потенциальным сотрудникам?