Как убивали человеческий фактор в видеонаблюдении

Как »короткие данные» (Short Data) превращают огромные терабайты видеоинформации в маленькие мегабайты, будет понятно из этого видеоролика:


Извините за его длительность, разработчик научился сокращать объемы информации, но не объяснения

Вообще в теме видеонаблюдения всегда на первом негативном месте стоял человеческий фактор. Внимательность оператора была под вопросом даже с одной видеокамерой. А в сегодняшних мега-количествах маленьких видео-окошечек (при этом огромного разрешения) найти что-то тревожное составляет совсем неразрешимую задачу. Если, конечно не применять более совершенные технологии.

f0f7f9ab1c93437fab50aa9c1f4dd72e.jpg

Для первичной обработки видеоконтента мы выбрали не мифические пересечения линий, постоянно реагирующие на всевозможные помехи и редко срабатывающие на полезные цели, а технологию »Short Data», которая не связана с распознаванием образов. О ней можем подробнее рассказать в следующий раз, если интересно. Но она, пусть и многократно, лишь отсеивает шлаки неинформативных данных, выделяя полезное зерно. А дальше снова — перед экраном человек.

d296f8b93df345dfb33212441b10d00e.jpg

К нам приходит видеоматериал не в виде 24 часовых огромных видеопотоков, а даже с большого числа объектов видеонаблюдения — всего один тонюсенький ручеек уже предобработанных данных. Видеособытия со всех объектов поступают в общий пул Видеоцентра и распределяются по свободным операторам, задача которых определить, есть ли в сюжете криминал, соответствует ли открывающий дверь квартиры профайлу разрешенных лиц или выполнение других условий, описанных в услуге клиента.

Для наблюдателя со стороны это крэзи-видео, потому что в этой очереди нет связки: оператор по очереди видит событие в подъезде города Махачкалы, потом на улице Караганды, затем во дворе частного дома под Хабаровском. Перед ним проходят сюжеты, между которыми нет ничего общего. Он даже не успевает порадоваться за чей-то роллс-ройс в Питере или огорчиться за выбитое окно в самарской деревне. К слову сказать, названий городов и адресов тоже нетМозг человека используется лишь для определения факта криминала в самом сюжете события.

63fb97aada95442e89f7c93961fe24be.jpg

Мозг — как винтик, никакого погружения в ауру объекта, как мы представляем себе любое кино. Без всестороннего охвата информации и всеобъемлющего анализа ситуации. Кому-то может показаться это ненадежным средством, но большинство народонаселения уже давно верит, что в видеонаблюдении и человек не нужен — компьютер сам всё может анализировать и распознавать. Мы по своей вере — центристы, верим лишь в возможности прогресса, но и не верим в то, что еще не удалось доказать. Поэтому при всей масштабной видеоаналитике последний штрих в анализе оставляем человеку.

При этом убираем всё, что присуще человеческому фактору: эмоции, невнимательность, ошибки анализа, сонливость, забывчивость, адресную составляющую… Мы превращаем его в машинный винтик общей системы, но немаловажный винтик — это природный фильтр помех. Никакой компьютер стопроцентно не отличит стаю птиц от вора, перелезающего через забор, своего родственника от незваного гостя, соседскую иномарку от иномарки хозяина. Даже, если поставить супермощный компьютер за 200 миллионов долларов, чтобы фильтровать помехи, он будет выдавать ошибки, ибо видеообработка основана лишь на контрастности. Отличить черные штаны на черном фоне и понять, что в них есть еще и тело, которого за деревом почти не видно, а светлое лицо на таком же фоне, повернутое затылком к камере, — это человек, может только один тип разума. Появление искусственного интеллекта пока запаздывает, может быть, так лет на сто. А человек решает эту задачку с одного взгляда.

d599b613497d44b493ab0ab59b78b033.jpg
Для компьютера это летящий объект размером с собаку, при этом стоящую на задних лапах

3a797b54cfa44cc5a9ad61a6b891e812.jpg
Для компьютера это один человек, а не три

Человек — это природный детектор опасности на базе инстинкта самосохранения. В отличие от самого мощного компьютера, самый низкий уровень IQ даже самой древней бабушке позволяет с максимальной точностью определить, что бандиты взламывают входную дверь, убивают человека или поджигают дом.

cad0ab1f80574bdabcb456e7d0a528b6.jpg

Естественно, человек физически не может смотреть в камеры долго, чтобы использовать свой IQ. Естественно, что каждый оператор отслеживает сразу тысячи объектов, за счет этого и достигается дешевизна услуги. Но вопрос человеческого фактора здесь не стоит, потому что сервис Айпиконсьержа соединил живых людей с технологиями видеоаналитики Short Data и собственной системой многоуровневого контроля. В этом виде видеонаблюдения вообще нет живого видео, никто ни в какие камеры не смотрит. Человек обрабатывает уже сформированные события, приходящие к нему одно за другим. Это напоминает конвейер, где рабочие закручивают гайки. Пришел видеоролик — оператор ставит резолюцию: «криминал» — «нет криминала». Если резолюция задерживается (кто-то уснул), видео-событие уходит на компьютер провизора. И потом еще выше. Таким образом невнимательность, отвлекаемость и задумчивость тоже убиваются в человеческом факторе.

a08ead04f38f4ba29455b383cc3af249.jpg

Хотя, конечно, не совсем. Добить их позволяет специальное ПО оператора. Чтобы не было необдуманного машинального клика, в каждой резолюции оператор описывает характер события: пробежала белая кошка, прошел высокий сосед, пролетела птица, предположительно синица. Заметьте, в каждом определении должна указываться примета: белая, высокий, синица… Это нужно не клиенту, а самому оператору, чтобы было четкое осознание увиденного — как говорят в Апиконссьерже — включение мозгов.

0315344954d94afdb33633b118de1849.jpg

И даже этим не ограничивается сервис Айпиконсьерж. Специальный программный бот-анализатор проверяет комментарии на предмет их адекватности, соответствию стилистике, грамматике, характеру деятельности, повторяемости и проч. Если за час появятся две кошки или каждый одинаковый период будет начинаться с кошки, или… — все варианты неосознанной записи тут же переправляются контролеру — провизору. Даже при большом желании расслабиться, набивать первые попавшие в голову фразы человек должен еще больше контролировать свой процесс, дабы не попасться на крючок хитрых бот-анализаторов. Всего одно нарушение — и оператор отстраняется от работы. И всегда в дежурной смене есть лишний ресурсный человек, готовый взять на себя повышение нагрузки, в том числе и за счет клиентских проблем.

adb28c2443b74cb2b2924eb029eb365f.jpg

Очень активно используется идентификатор лиц. Когда стоит задача определить, соответствует ли открывающий дверь человек профайлу разрешенных лиц, машина сама определяет уровень сходства, но ничего не говорит об этом оператору. Только в случае его явной ошибки, она выдает громкое предупреждение, которое отправляется и провизору. Т.е. мы не доверяем компьютерной логике при охране клиента, а лишь используем ее для контроля своего сотрудника.

52115d8a83714b7c978313ac68eaa280.jpg

Конечно, нужно добавить, что иногда приходится переключать человеческий интеллект в режим полного охвата информации. В редких случаях мы сталкиваемся со спорными ситуациями, когда видно что-то подозрительное, но конкретных фактов криминала нет. По клику на таком событии выходит вся история данного конкретного объекта за последние 24 часа, и оператор имеет возможность более детально исследовать свои сомнения.

К примеру, бывает так, что кто-то выбегает из квартиры в явно подозрительном состоянии и с большой коробкой в руках, а в истории нет даже такого события, что он в квартиру и не заходил. Тут всё просто, хозяева сэкономили на камере, поставив только одну на входной площадке, а данный тип залез через балкон. Формально мы не несем никакой ответственности, т.к. в профайле указан лишь контроль входа, но все мы люди, и счастье клиента нам дорого (чем дольше он живет — тем дольше платит). В технологии Short Data есть ряд алгоритмов, определяющих резкие отличия от постоянного образа жизни и поведения хозяев. В этих случаях история событий раскрывается автоматически. И оператор должен дать оценку причины такого раскрытия с указанием причины появления указанных зон детекции. Если он не дотронулся до них мышкой, наш софт сигнализирует о ненадлежащем исследовании проблемы. У оператора просто нет возможности недобросовестно выполнить свою работу.

Есть у нас и собственная база квартирных воришек. Да, она несовершенна, фотографии плохого качества, идентификация компьютером маловероятна, но не надо забывать, что у нас работают не только компьютеры, но и люди. При любом подозрительном событии черный список всплывает перед оператором. И, как вы уже, наверное, догадались, не просто так. Теперь перед человеком стоит задача указать на самого похожего человека в этом фотоальбоме.

8591ccb742b045ffa1a73f8a41828fab.jpg

В отличие от традиционного видеонаблюдения, наш оператор всю свою смену решает логические задачки, этот вариант мы называем активным видеонаблюдением.

«Короткие данные» помогают человеку в разгрузке информации, а наши технологии предназначены для убийства человеческого фактора. Возможно, мы что-то еще не учли, поэтому и ждем обратной связи от сообществ.

© Geektimes