Как журналист помогает выявлять серийных убийц с помощью алгоритма

b11880589e726e5b205660a468c53c9f.png

17 октября 2014 года в мотеле маленького городка Хаммонд, Индиана, был обнаружен труп 19 летней Африки Харди. Вызванные на место полицейские почти сразу пришли к выводу, что это было убийство. На поиски убийцы ушло меньше суток — его обнаружили по записям камер наблюдения, установленных возле мотеля, а также по анализу телефонных разговоров жертвы (в номере был найден её телефон).

43-летний Даррен Ванн был арестован уже 18 октября и, как ни странно, совсем не был удивлён появлению полиции. Когда наручники защёлкнулись на его запястьях, Даррен повернулся и сказал полицейскому: «Наконец-то вы меня поймали». Так попался серийный убийца, жертвами которого стали ещё минимум шесть женщин. Но как полагали детективы, на самом деле счёт приближался к 20. 

Примечательно в этой истории то, что полиция могла бы поймать Даррена Вана ещё за 4 года до этого. Но никто не хотел слушать Томаса Харгроува — бывшего журналиста, который помогает искать маньяков с помощью собственного алгоритма, о котором и пойдёт далее речь.

Как все начиналось

Сейчас Томасу Харгроуву 67 лет, и последние 13 лет он занимается выявлениями закономерностей в поведении серийных убийц. Для этого он годами собирал базу данных преступлений, совершаемых в США: за период с 1965 по 2021 год накопилась информация почти по 1 млн преступлений! Харгроув разработал алгоритм, который позволяет обрабатывать этот массив данных и отличать серийные убийства от бытовой поножовщины или семейных разборок. Его алгоритм работает, и в 2017–2020 годах он помог выявить душителя Артура Хиллиарда в Чикаго, убившего 51 женщину.  

Этот улыбающийся мужчина — журналист на пенсии, по совместительству энтузиаст в программировании и поиске преступников

Этот улыбающийся мужчина — журналист на пенсии, по совместительству энтузиаст в программировании и поиске преступников

Но обо всём по-порядку. Выбор работы Харгроува не был случайным — его отец писал руководства для механических калькуляторов и очень верил, что будущее сына будет связано с точными науками. Томас искренне любил математику, однако же поступил на факультет журналистики в университет штата Миссури.

Тем не менее математика ему пригодилась, когда на курсе им рассказывали про использование теории вероятности в социологических исследованиях. Одна из тем звучала примерно так: как убедиться в том, что случайный набор данных — действительно случайный, и что выборка по-настоящему репрезентативная. В те же годы на глаза ему попалась книга Филипа Майера «Точная журналистика» (Precision Journalism). 

Эта книга и лекции в университете изменили мой подход к тому, что такое журналистика — признаётся Томас годы спустя.

В 1977 году Томас окончил университет и устроился на работу в газету Birmingham Post-Herald, в которой должен был проводить и публиковать опросы местного населения. Однако спустя год, в 1978 году, молодой Харгроув зашёл в магазин купить продуктов и нарвался на ограбление: владелец отказался отдавать деньги грабителям, и бедолагу застрелили. Это произвело на него сильнейшее впечатление — в голове появилось много вопросов: что двигало этими людьми, насколько много других таких случаев в городе и так далее. В газете как раз удачно появилась вакансия журналиста криминальной хроники, и Томас устроился туда. 

В 1990 году, проработав 12 лет в газете, журналист перебрался из провинциального городка в Вашингтон и устроился в новостное агентство Скриппса Хоуварда. Там его задача была сформулирована однозначно: используя статистические данные, выдавать сенсационные материалы. Тем более, в резюме у него было расследование махинаций на выборах в Алабаме, в ходе которого Харгроув проанализировал тысячи отчётов о голосовании на разных избирательных участках. Это расследование привело к тому, что законодательное собрание в 1989 году изменило процедуру подсчёта голосов и сделала её более прозрачной. 

Моей основной целью было шокировать людей при помощи чисел, — говорит Харгроув

Например, он провёл анализ данных, публикуемых организацией Centers for Disease Control (CDC), и выявил, что те проводят махинацию с данными. Скажем, нужно показать, что качество медицинского обеспечения в каком-то городе недостаточное — почему бы не завысить статистику по смертности там? Так, администрация обратит внимание и инвестирует деньги в больницы. Вроде благородное дело, однако для этого они записывали в умерших вполне себе живых людей. А когда грант выделялся, по-тихому удаляли их оттуда.

Анализ баз данных этой организации помог выявить закономерность. А когда Харгроув встретился с этими людьми, то выяснил, что они в курсе своей проблемы: ведь им не выдают кредиты и не берут на работу (ничего удивительного — они же покойники). Эти «мёртвые души» неоднократно писали об этом жалобы в разные инстанции, но никто не реагировал. Расследование же на крупнейшем новостном портале дало делу толчок. 

После такого крупного успеха Харгроув стал непререкаемым авторитетом в редакции и уже мог выбирать, что и зачем ему расследовать. 

В своих расследованиях Томас использовал всего две вещи: программирование и логику. До этого никто не подходил к журналистике так скрупулёзно, — вспоминает коллега Айзек Вульф.

Ещё одним знаковым расследованием стал анализ такого явления, как синдром внезапной детской смертности — СВДС. Для этого он взял аналитику Центра по контролю за заболеваниями и увидел странности. Например, во Флориде от СВДС умирало намного меньше младенцев, чем в Калифорнии. Как это можно объяснить?  

Чтобы разобраться, Харгроув поехал в Калифорнию и Флориду и пообщался с десятками патологоанатомов. Каково же было его удивление, когда многие из них сказали, что никакого СВДС не существует. Просто некоторые родители пеленали младенцев и клали их неправильно, из-за чего те задыхались во сне. И происходило это плюс-минус одинаково что во Флориде, что в Калифорнии. 

 Статистическая странность объяснялась просто: власти Калифорнии в любой непонятной ситуации приписывали смерти к загадочной СВДС. Это позволяло получать дополнительные деньги на исследование проблемы, да и меньше было юридической волокиты с расследованием. А во Флориде все указывали по-честному.  

После этой истории CDC создал Реестр случаев внезапной неожиданной детской смерти для оценки каждой смерти. А усилия Харгроува привели к тому, что в 2014 тогдашний президент Барак Обама подписал Sudden Unexpected Death Data Enhancement and Awareness Act (Закон о расширении данных и осведомлённости СВДС).

Сенатор Фрэнк Лаутенберг — человек, который активно продвигал инициативу Харгроува и помог в принятии важнейшего закона о контроле за СВДС

Сенатор Фрэнк Лаутенберг — человек, который активно продвигал инициативу Харгроува и помог в принятии важнейшего закона о контроле за СВДС

Расследования Харгроува были настолько удачными, что боссы создали исследовательский центр Scripps Survey при университете штата Огайо, который занимался анализом федеральных баз данных. Харгроув стал в нём главным специалистом. 

В 2004 год Харгроув решил провести расследование о проституции: есть ли какая-то зависимость между распространённостью явления и законодательными ограничениями в разных штатах? Для этого Томас запросил информацию у ФБР и получил компакт-диск с объемным отчетом обо всех преступлениях за 2002 год, в том числе об убийствах. При этом по каждому делу указывалась не просто дата, а ещё дополнительные переменные: возраст, раса, пол, орудие, место убийство и так далее. 

Первое, о чём я подумал: было бы здорово загрузить эти данные в компьютер и помочь поймать самых опасных преступников, таких как серийные убийцы, — говорит Харгроув.

Когда журналист пришёл к своим боссам с этой идеей, те поначалу покрутили пальцем у виска. Но Харгроув был настойчив и своим авторитетом сумел убедить начальство — те дали добро на разработку такого алгоритма. Харгроув назвал его «Детектор серийных убийц».

Надо отметить, что до этого попытка создать подобный алгоритм в ФБР уже была. Некий детектив из Лос-Анджелеса Пирс Брукс работал над одним расследованием в 1960-х годах. У детектива было подозрение, что подобные убийства уже случались раньше, поэтому он исследовал отчёты и газетные вырезки. В тот момент ему в голову пришла идея: почему бы не создать такую же базу в цифровом виде? Ведь компьютеры на тот момент уже были. 

Пирс Брукс — родоначальник системы ViCAP

Пирс Брукс — родоначальник системы ViCAP

В 1983 году он пришёл в ФБР и предложил создать единую базу преступлений. В ответ бюро выделило ему кабинет в Квантико (своей главной штаб-квартире) и купило оборудование для запуска системы — её назвали ViCAP (Violent Criminal Apprehension Program). Но чтобы собрать полную базу и учесть нужные переменные, по каждому убийству нужно заполнять много данных, фиксирующих буквально каждый элемент преступления. Если быть точным, детективам приходилось отвечать на 150 (!!!) вопросов в анкете. Представьте, что ещё вчера вы писали отчёт за два дня, а теперь на него уходит месяц? Поэтому нововведение встречало серьёзное сопротивление системы —, но об этом дальше. 

В 2008 году система заработала, и детективам был предоставлен доступ к ней. Однако её эффективность и полнота вызывали большие вопросы. Харгроув про это знал и хотел сделать программу лучше и надёжнее, при этом открытой для пользователей. 

Что за алгоритм создал журналист

Для начала Харгроув запросил у ФБР отчёты об убийствах за период с 1980 по 2001 год. Диапазон был выбран неслучайно: Харгроув решил вычислить знаменитого «Убийцу с Грин-Ривер» — Гэри Риджуэя, который за 20 лет убил 49 человек. Если он сможет выявить закономерность и вычислить его, то и с остальными это получится. Примечательно то, что это первый убийца, которого смогли поймать благодаря анализу ДНК в 2001 году. 

Томас Харгроув повесил фотографию Риджуэя на стену, чтобы смотреть ему в глаза и пытаться угадать, как статистически должен выглядеть серийный убийца

Томас Харгроув повесил фотографию Риджуэя на стену, чтобы смотреть ему в глаза и пытаться угадать, как статистически должен выглядеть серийный убийца

Объём данных был огромным: более 500 000 отчётов. Нужно было понять, как же среди этих данных вычислить убийцу?

Итак, между убийствами были некоторые схожие элементы: все жертвы — молодые девушки (чаще всего проститутки). Убийца душил их и сбрасывал в реку Грин-Ривер или оставлял в лесу в окрестностях Сиэтла. 

Однако разные комбинации запросов ничего не давали — серия преступлений не прослеживалась. 

Только спустя месяцы экспериментов Харгроува наконец-то ждал успех — вот что он не учитывал изначально:

  • Девушек находили не сразу — многие из них пролежали на открытом воздухе месяцами, прежде чем их обнаружили. Из-за степени разложения коронеры не могли определить причину смерти и часто вообще не относили жертву к убийствам. Ну купалась, может, или сердце прихватило? Надо нам оно, расследовать «висяк» очередной?

  • Нужно было брать во внимание процент раскрытия дел и скорость расследования. Представьте, если у вас орудует маньяк, да ещё и такой продуктивный, как Риджуэй. С высокой вероятностью процент раскрытия дел в городе будет отличаться от среднего по стране. А если маньяк орудует ещё и давно, то даже если какие-то дела будут раскрываться, на общий процент это повлияет с задержкой.

  • Анализировать надо было не только места обнаружения тел, но и предполагаемое место сброса в реку. Потому что в ряде случаев детективы по скорости течения реки и времени разложения определяли, в какой части реки маньяк сбрасывал тела. 

Когда эти критерии поиска были учтены в запросах, алгоритм показал на аномальную ситуацию именно в Сиэтле — всё получилось. Конечно, в суде такое бы не приняли, и связь всех этих преступлений нужно доказывать законным путём: анализ ДНК и отпечатков пальцев, орудия убийства, показания свидетелей, алиби и прочего. Но маякнуть, что у вас в городе, возможно, действует убийца — это может оказаться полезным для полиции. 

Для того чтобы учитывать специфику работы детективов и понять, какие переменные являются существенными, Харгроув обратился к специалисту — Эрику Витцигу, детективу на пенсии, который был весьма известен: например, расследовал покушение на Рейгана и крушение лайнера Air Florida Flight 90. К слову, Витциг работал с Пирсом Бруксом над системой ViCAP и лучше других понимал, в чём её недостатки.

К сожалению, Эрик Витциг скончался 18 февраля 2020 года в возрасте 73 лет. Но его вклад в проект Харгроува бесценен

К сожалению, Эрик Витциг скончался 18 февраля 2020 года в возрасте 73 лет. Но его вклад в проект Харгроува бесценен

Витциг очень помог Харгроуву, поделившись опытом и вместе с ним определив критерии, которые строго определяли, что можно считать случайным фактором, а что — закономерностью. По ссылке можно скачать программный документ, в котором Эрик описывает критерии более подробно. 

Например, один из важнейших критериев — это место убийства. И здесь Харгроув и Витциг опирались на идеи Кима Россмо, который придумал новую дисциплину: географические профилирование. В 1991 году бывший полицейский предложил математическую формулу, которая помогает предсказать, где живёт убийца, на основе данных о местах его преступлений:

где Xi/Yi и xn/yn — это координаты предполагаемого района проживания убийцы и мест совершения преступления соответственно, а фij — характеристическая функция случайной величины.

Эта формула получила название формулы Россма и стала использоваться в криминалистике. 

В расследовании, если не брать в расчёт голливудские истории, речь всегда идёт об информации. В любом деле о серийных убийствах у полиции будут тысячи подозреваемых. Но нужно с чего-то начинать, и мы много знаем о том, что серийные убийцы, как правило, охотятся за добычей в определённом районе, который можно определить и изучить.

С психологической точки зрения, убийцы часто не могут отойти далеко от дома, потому что всегда есть страх, что тебя поймают. И в какой-то момент ощущение, что ты сможешь поскорее закрыться в доме и спастись в случае опасности, перевешивает. Вот эти вероятностные зоны и помогают сузить круг подозреваемых.

Надо отметить, что этот же подход с привязкой к географическому профилированию, который использовал Харгроув, не позволяет выявлять кочующих убийц, таких как Тед Банди. Дополнительно он плохо работает в небольших городах, поскольку детективы там неохотно публикуют отчёты о преступлениях.

Однако, несмотря на все ограничения, стало ясно, что в целом алгоритм работает. Харгроув и Витциг привлекли ещё 9 человек, которые вошли в совет нового проекта, который получил название MAP (Murder Accountability Project). Со временем у них появился сайт, на который может попасть любой желающий и попытаться самостоятельно выявить закономерности в совершении преступлений. 

Для пользователя есть несколько вариантов, как это можно это сделать. Разберём на примере поиска всё того же «Убийцы с Грин-Ривер»:

1. Clearance Rates. Классическая диаграмма, позволяющая посмотреть общую статистику преступлений. Пользователь выбирает штат, округ и управление, по которому вы хотите посмотреть статистику, а также временной интервал. 

Общая высота столбика показывает количество преступлений, серые столбики — раскрытые убийства, красные — нераскрытые

Общая высота столбика показывает количество преступлений, серые столбики — раскрытые убийства, красные — нераскрытые

Годы пиковой активности Риджуэя — 1983 и 1985, именно в них красные столбики самые высокие. Это аномально для 80-х годов, когда средний процент раскрываемости в Америке был намного больше, чем в 90-е годы (красные столбики тут тоже высокие). Косвенно это подтверждает нашу догадку.

2. Search Cases. Это уже более детальная визуализация, где мы можем задать больше параметров. Отчёт формируется не просто публичную статистику, а так называемые SHR (Supplementary Homicide Reports) — расширенные отчёты о преступлениях. Здесь уже можно задать орудие убийства, пол жертвы, расу, возраст и обстоятельства, оптимально сгруппированные и классифицированные. 

Более точный отчёт на основе расширенных отчётов SHR

Более точный отчёт на основе расширенных отчётов SHR

На большой гистограмме в левой части экрана (под заголовком «Подозреваемый был идентифицирован во время отчёта?») показаны отчёты о женщинах, которые были задушены или умерли по неизвестным причинам в районе Сиэтла. Как мы говорили, судмедэксперт не мог установить точную причину смерти. Большинство этих убийств произошло в середине 1980-х от рук «Убийцы с Грин-Ривер» Гэри Риджуэя.

Если кликнуть по красному столбцу 1982 года, то можно попасть на табличное представление данных, прямо из отчётов полиции.

Можно обратить внимание, что было убито шесть белых женщин, большая часть в возрасте 16-17 лет, причина смерти — удушение 

Можно обратить внимание, что было убито шесть белых женщин, большая часть в возрасте 16–17 лет, причина смерти — удушение 

3. County Clusters. Данные на географической карте США. Много параметров здесь не выводится, но чтобы оценить отклонение от среднего и выявить аномалии (например, серии убийств) — отлично подходит.

Пример того, как пользоваться визуализацией. Красный круг в районе Сиэтла — это жертвы «Убийцы с Грин-Ривер». Рядом Вашингтон, но ничего подобного не наблюдается

Пример того, как пользоваться визуализацией. Красный круг в районе Сиэтла — это жертвы «Убийцы с Грин-Ривер». Рядом Вашингтон, но ничего подобного не наблюдается

4. Скачать базу самостоятельно. Но никто не заставляет пользоваться теми же критериями, что и авторы MAP. 7,3 Гб отчётов со всеми убийствами с 1965 по 2019 год доступны по ссылке. Также есть единый отчёт в формате CSV, но без деталей вроде возраста, орудия убийства и прочего.

Более подробно ознакомиться с документацией и самим кодом (достаточно простым и компактным) вы можете, пройдя по ссылке.

Чем этот подход помогает

Алгоритм успешно заработал, и в 2010 году Харгроув обратил внимание, что в городе Гэри (штат Индиана) происходят убийства, укладывающиеся в серию. Проанализировав период с 1980 по 2008 год, он увидел, что было задушено 15 женщин. Почти все тела была обнаружены в пустующих домах, коих в Гэри было великое множество — признак не самой удачной экономической ситуации, сложившейся в пригороде Чикаго. 

Как добропорядочный гражданин, Томас написал в полицию и изложил свои соображения. «Как вы полагаете, это может быть серийный убийца?», — спросил он в письме.

В ответ, как водится, полицейский сообщил ему, что в Гэри нет никаких серийных убийц. А то, что он там нарыл — это все выдумки. 

Я оставлял сообщения месяцами, — говорит Томас. — Писал не только в полицию города, но и руководителю департамента штата и даже мэру. Никаких результатов.

Однако не все были согласны с таким отношением высшего руководства. Например, заместитель коронера, которая занималась вскрытием трупов, также пришла к выводу, что в Гэри есть маньяк. К ней тоже никто не прислушался. Тогда она скооперировалась с Харгроувом и совместными усилиями они выявили ещё три потенциальных жертвы. Но это ничем не помогло.

Прошло четыре года, и полиция Хаммонда арестовала Даррела Вана — убийцу 19 летней Африки Харди, с которой мы начали наш рассказ. И он признался в серии убийств, которые начались ещё в 90-х годах. 

Признание Даррела Вана — запись из комнаты допроса в полицейском участке:

Дальше парень отвозит полицию в заброшенные дома, где они находят тела шести женщин, и все они задушены. В полном соответствии с тем, что мы предсказывали при помощи алгоритма, — говорит Харгроув.

Ванн убил свою первую женщину в начале девяностых. В 2009 году он попал в тюрьму за изнасилование, и убийства прекратились. Когда он вышел в 2013 году, «он продолжил с того места, на котором остановился». Причём он официально состоял в реестре сексуальных преступников.

Заброшенные дома, в которые Ванн отвёл полицию. Некоторые тела так разложились, что их не смогли опознать

Заброшенные дома, в которые Ванн отвёл полицию. Некоторые тела так разложились, что их не смогли опознать

Примечательно, что только одна женщина считалась пропавшей без вести. То есть полиция вполне себе законно не хотела искать серийного убийцу — ведь родственников, которые бы пошли жаловаться, не было. 

Джон Даути, начальник полиции, на пресс-конференции говорит, что серия убийств продолжается уже 20 лет. Но полиция ни в чём не виновата!

Джон Даути, начальник полиции, на пресс-конференции говорит, что серия убийств продолжается уже 20 лет. Но полиция ни в чём не виновата!

Мэр города заявила: «Власти Гэри делали всё возможное, чтобы заколотить и снести заброшенные дома, но было невозможно убрать все обветшалые дома. У нас есть 10 000 заброшенных зданий, и мы можем указать только пять из них, в которых находились эти тела».

Вот так закостенелая бюрократия, нежелание делать лишнюю работу и страх перед тем, что компьютеры отберут хлеб у полиции, привели к тому, что погибли девушки. Если бы к Харгроуву прислушались, то смертей можно было избежать. 

Палки в колёса вставляют буквально на всех уровнях: многие полицейские департаменты и даже ФБР отказываются предоставлять данные. Поэтому Харгроув делает то, что и должен делать сознательный гражданин: подаёт на всех в суд. В 2018 году власти не указали почти 3000 преступлений — эксперты MAP определили это, сравнив количество заключений судебно-медицинской экспертизы по насильственным случаям и предоставленные полицией отчёты.  

Кому-то просто невыгодно, чтобы наша организация влезала в расследования. Однако есть закон, и его надо соблюдать всем, в том числе и Министерству Юстиции.

Усилия MAP привели к тому, что в их базе данных уже на 27 тысяч дел больше, чем в реестре ФБР. Это важные усилия, потому что уровень нераскрытых дел по всему миру увеличивается. Например, в США в 60-х годах раскрывалось 92% преступлений, в 2020 году средний процент составил — 60%, рекордно низкие показатели.

Процент нераскрытых дел с каждым годом растёт. Причём преступлений совершается меньше, чем в 90-е

Процент нераскрытых дел с каждым годом растёт. Причём преступлений совершается меньше, чем в 90-е

Во многом это говорит о том, что преступники становятся более изворотливыми и их сложнее искать. По оценкам Харгроува, в США на свободе сейчас находятся две тысячи серийных убийц. Чтобы их поймать, нужно использовать все доступные средства: особенно системы цифрового поиска и анализа. 

Например, использование алгоритма MAP позволило выявить серию из 51 убийства женщин в Чикаго. 

На основе анализа убийств за 2001-2014 стало понятно, что речь идёт о маньяке, который задушил 50 женщин

3 марта 2017 года 21-летняя Даймонд Тёрнер была найдена задушенной, избитой и раздетой в мусорном баке на одной из Чикагских улиц. На тот момент полиция Чикаго уже была предупреждена о возможной связи с другими убийствами, и смогла сравнить ДНК с разных мест преступлений. На тот момент под подозрением уже находился некий Артур Хиллард — однако теперь сравнение образцов ДНК и обстоятельств смерти позволило предъявить ему обвинение. 

Глупо отрицать, насколько современные технологии могут помочь правоохранительным органам.

Какое будущее нас ждёт

Давайте повангуем о внедрении технологий на примере нейросетей, которые вполне можно использовать для расследования преступлений. Потенциал их настолько безграничен, что алгоритм Харгроува покажется детской игрушкой. Тем не менее путь, который уже прошел проект MAP, обозначил главные проблемы, с которыми внедрение таких технологий наверняка столкнется.

Сама система очень закрытая. Для обучения нейросети нужно получить доступ к данным. Если в США усилия энтузиастов вроде Харгроува и справедливая судебная система дают на это шансы (и то с большим трудом), то в России это вряд ли будет возможно в ближайшие годы. Или кто-то всерьез думает, что Басманный суд г. Москвы вынесет решение в пользу дата-сайентиста Васи Пупкина собравшего очередную нейросеть, после подачи от него иска в отношении Министерства внутренних дел? Что, мол, кто-то какие-то отчеты отказывается публиковать?

Система не любит изменений. Передовые технологии внедряются в правоохранительные органы с некоторым опозданием. Собственно их взаимодействие можно иллюстрировать одним фото.

Правоохранители не хотят терять работу. Собственно, ее никто не хочет терять. Но при этом полиция имеет намного больше рычагов лоббирования своих интересов, в том числе политических. В тех же США, когда встанет вопрос об увольнении сотен неэффективных детективов, республиканская партия в первых рядах заблокирует любые возможности применения технологий. Про наших силовиков я вообще молчу. 

Нам лишь остается только верить в хорошее и надеяться, что в будущем, технологии все-таки будут способствовать безопасности в обществе.

НЛО прилетело и оставило здесь промокод для читателей нашего блога:

-15% на заказ любого VDS (кроме тарифа Прогрев) — HABRFIRSTVDS.

© Habrahabr.ru