В этом году все уличные видеокамеры Москвы подключат к системе распознавания лиц
Система распознавания лиц компании NTechLab. Фото: NtechLab
Многие слышали про успехи системы видеонаблюдения в Китае, которая объединяет более 170 млн видеокамер, подключённых к единой системе распознавания лиц. К 2020 году количество камер увеличится до 400 млн, плюс видеонаблюдение заработает через другие устройства, в том числе через «умные» очки полицейских. Благодаря тотальной слежке власти надеются, что смогут быстро определять местоположение любого преступника, который находится в федеральном розыске. Разумеется, доступ к такой системе даёт массу иных преимуществ.
Аналогичная система развернётся в Москве. В этом году власти собираются подключить к системе распознавания лиц все уличные видеокамеры, сообщают государственные СМИ. Таким образом, по темпам интеграции Москва не отстаёт от Китая.
Подрядчика для внедрения распознавания лиц выберут на тендере. Один из претендентов — компания NTechLab и технология FindFace, с которой проводился эксперимент полтора года назад. Тогда эксперимент признали успешным.
Кроме неё, в тендере участвует IVA Cognitive и несколько других компаний. «Осталось несколько претендентов, в том числе мы. Возможно, выберут одного или организуют что-то вроде консорциума из нескольких компаний. Поделят камеры и посмотрят, кто как справляется. Таким образом, сохранится конкуренция, технология будет развиваться», — рассказал Алексей Цессарский, генеральный директор компании IVA Cognitive, разрабатывающей систему видеоаналитики IVA CV.
Артём Кухаренко, основатель компании NtechLab, говорит, что в текущих настройках вероятность ложных срабатывания системы — 0,00001%, то есть один на десять миллионов. Цессарский приводит оценку точности до 99% (о путанице в метриках и некорректном использовании терминов читайте статью «Правда и ложь систем распознавания лиц»).
На самом деле все параметры регулируются. Если мы хотим минимизировать количество ложноположительных срабатываний, то у нас будет много ложноотрицательных, то есть система будет пропускать (не узнавать) многих реальных преступников. И наоборот, если мы хотим на 100% распознавать всех преступников, то есть минимизировать количество ложноотрицательных ошибок, то неизбежно вместе с преступниками задержим множество невиновных граждан за счёт максимизации ложноположительных ошибок. Разумеется, для городских систем видеонаблюдения предпочтительнее первый вариант.
Турникеты на станции метро «Октябрьское Поле» в Москве подключены к системе распознавания лиц. Фото: РИА Новости / Евгений Одиноков
Технологию распознавания проверили во время чемпионата мира по футболу, где она «помогла задержать более ста правонарушителей, раскрыть кражу спонсорского кубка и предотвратить давку в одной из фанзон». Кроме того, эксперты проходили на Казанском вокзале Москвы, на стадионе «Петровский» в Санкт-Петербурге. В начале 2018 года пилотный проект по тестированию системы распознавания лиц запустили и в Домодедово. Похожие системы действуют в Альметьевске (Татарстан) и других городах. В Татарстане в прошлом году с помощью системы видеонаблюдения раскрыли 1971 преступление.
По данным PwC, в Москве плотность видеокамер составляет 54,6 штуки на квадратный километр. И Москва стала одним из первых мегаполисов, который внедряет систему распознавания лиц в городской сети видеонаблюдения.
«Технологии анализа видеопотока активно применяются в рамках концепции «умный город» по всему миру, этот рынок постоянно растет. Москва не просто оказалась в тренде, а показала себя суперпрогрессивной столицей — с точки зрения как масштаба, так и уровня решений», — говорил в 2017 году генеральный директор NTechLab Михаил Иванов. Наверное, эта оценка актуальна и сегодня.
После интеграции всех уличных камер в единую сеть эффективность работы системы значительно увеличится: «Видеопоток со всех подключенных камер анализируется, лица распознаются и сохраняются некоторое время в базе. Далее фото человека из списка разыскиваемых загружается в систему и выполняется поиск среди накопленной истории, — объяснил Цессарский один из сценариев работы системы. — Программа показывает, какие камеры и когда видели этого человека. Можно восстановить его маршрут, определить, где и когда он был в последний раз, загрузить видео оттуда и посмотреть, что он там делал». По другому сценарию, система в реальном времени сравнивает картинку со всех видеокамер с фотографиями из базы — и в случае положительного срабатывания в полицию поступает мгновенное уведомление.
Как видим, первый сценарий представляет собой некое подобие закона Яровой, только в применении к передвижениям «человеческого трафика».
До конца текущего года в Москве будет работать более 174 000 камер. Сеть видеонаблюдения объединяет подъездные видеокамеры (95% подъездов жилых домов в столице), камеры на территории и в зданиях школ и детских садов, на станциях МЦК, стадионах, остановках общественного транспорта и автовокзалах, в парках, подземных переходах, сообщает официальный портал мэра и правительства Москвы. «Внедрение видеоаналитики является мощным драйвером повышения эффективности как частных, так и городских систем видеонаблюдения. У жителей города появился дополнительный уровень защиты, — заявил руководитель Департамента информационных технологий Москвы Артём Ермолаев. — Разумеется, все эти возможности должны внедряться очень ответственно. Наш приоритет — баланс между конфиденциальностью и безопасностью, и мы придерживаемся строгой внутренней политики контроля, гарантирующей соблюдение прав граждан».
«Установка в каком-то районе города камер наблюдений уменьшает количество преступлений на 20% или даже 40%, — говорит Алексей Цессарский. Все зависит от того, насколько криминогенной была обстановка. Если человек знает, что его распознают на видео и найдут, он дважды подумает, прежде чем решится на правонарушение».
Распознавание лиц людей по всему городу предоставляет уникальные возможности сотрудникам правоохранительных органов. Они могут ввести в поиск фотографию человека — и узнать, где он сейчас находится, по какому маршруту передвигается и т.д.
Пример идентификации
Программное обеспечение NTechLab использует нейросети и машинное обучение. Именно эта фирма разработала известное приложение FindFace. В своё время СМИ облетели несколько историй об этом сервисе, который быстро узнаёт личность почти любого прохожего, достаточно сделать его фото и загрузить в приложение на смартфоне. Программу использовали даже для деанонимизации российских порноактрис — по кадрам из фильмов пользователи находили этих девушек в социальных сетях, устанавливая личность по школьным фотографиям и т.д.
Правоохранительные органы могут провернуть этот фокус и сейчас, но уже не по фотографиям из социальных сетей, а в целой системе видеонаблюдения Москвы. Эффективность нейросети NTechLab подтверждена независимыми сравнительными тестами систем распознавания лиц, которые проводили Министерство торговли США и Вашингтонский университет (конкурс FaceScrub). «Наша технология считается лучшей в мире по качеству работы с самой сложной по метрике NIST базой изображений wild exploration. Она включает фото людей, снятые в стихийных условиях и с разным разрешением, причём лица могут быть частично закрыты», — пояснил основатель NTechLab Арт`м Кухаренко.
Но в камерах видеонаблюдения точность распознавания гораздо ниже, чем в тестах: «Камеры городского видеонаблюдения динамические: они двигаются вправо-влево, приближаются и удаляются. В таких условиях добиться даже распознавания 60–70% изображений крайне сложно. Результат в 30% уже космический», — говорил Артём Ермолаев в комментарии для РБК полтора года назад.
Демо-зона Городской системы видеонаблюдения Москвы в павильоне «Умный город» на ВДНХ
По его словам, мощности системы пока не хватает для тотальной слежки и распознавания всех горожан в реальном времени. То есть система не может составлять пофамильные списки всех, кто входит в каждый подъезд каждого дома: для этого требуется слишком много ресурсов. Пока что она может только найти на всех видеокамерах отдельных людей, чьи лица загружены в базу данных.
В 2017 году Артём Ермолаев сказал, что московское правительство тратит около 5 млрд руб ($86 млн) в год на поддержание системы видеонаблюдения, а если к системе распознавания лиц подключить все 170 000 камер, то эта сумма утроится.
Видео с камер передаётся в единый центр хранения и обработки данных (ЕЦХД) и хранится пять суток.
Кроме распознавания лиц, сейчас актуальной задачей разработчиков является анализ жестов, поз. Это позволит оценить намерения группы людей и предотвратить опасную ситуацию.
«Речь идет о паттернах поведения человека. Систему можно натренировать на поиск скопления людей там, где обычно по статистике этого не должно быть, или выявление подозрительных действий: кто-то очень быстро размахивает руками, бежит, выхватывает предмет, напоминающий оружие. Обнаружив в видеопотоке определенные паттерны, программа отправляет уведомление. Это, по сути, мониторинг потенциально опасных ситуаций», — рассказал Цессарский.
По словам Кухаренко, если использовать вместе несколько сценариев — поиск лиц в розыске, подсчёт людей и оценку поведения — это выведет безопасность массовых мероприятий на принципиально новый уровень. Кроме того, в будущем это открывает двери для полноценной меритократии.
Например, в Китае сейчас разворачивают общенациональную систему социального кредита — каждый гражданин получает определённый рейтинг, в зависимости от своих действий в обществе. Хорошие, добропорядочные и честные граждане будут иметь высокий социальный рейтинг. Вороватые, эгоистичные граждане — низкий рейтинг, если они не делают ничего хорошего для общества.
От социального рейтинга зависит, насколько этому человеку можно доверять, можно ли ему выдавать вещи в прокат без залога, кредит на большую сумму и т. д. Если человек совершает преступление — от его социального рейтинга отнимают определённое количество баллов. Если перевёл бабушку через дорогу — начисляют дополнительные баллы. Люди с высоким социальным рейтингом — умные, добрые и всеми любимые граждане — получат почёт, уважение, спецобслуживание в общественных учреждениях и т.д.
В сентябре 2016 года правительство Китая опубликовало уточнённый перечень санкций, которым будут подвергаться обладатели низких рейтингов:
- запрет на работу в госучреждениях;
- отказ в соцобеспечении;
- особо тщательный досмотр на таможне;
- запрет на занятие руководящих должностей в пищевой и фармацевтической промышленности;
- отказ в авиабилетах и спальном месте в ночных поездах;
- отказ в местах в люксовых гостиницах и ресторанах;
- запрет на обучение детей в дорогих частных школах.
Возможно, в будущем люди с большим социальным рейтингом даже будут иметь больший вес при голосовании на выборах. То есть голос высокообразованного семьянина с тремя детьми на выборах не будет равен голосу пьяницы с низким IQ, как сейчас, а будет в несколько раз весомее. Таким образом можно отказаться от нынешней диктатуры необразованного большинства и перейти к более «продвинутым» формам демократии. По большому счёту, это в каком-то роде реализация идеи меритократии, когда личные достижения человека зависят лишь от его способностей, трудолюбия, жизненных установок и нравственности.
Система тотального видеонаблюдения с распознаванием лиц может органически вписаться в концепцию социального рейтинга. Постоянно отслеживая все действия каждого человека, система может автоматически оценивать эти действия — и изменять социальный рейтинг каждого человека в реальном режиме времени. Разумеется, ради высокого рейтинга человеку придётся частично пожертвовать своей приватностью, отказаться от ношения чёрных очков, кепок и других маскирующих элементов одежды.
Контролирующие органы должны внимательно следить, чтобы система не использовалась для злоупотреблений. Наверняка найдётся много желающих использовать этот мощный инструмент в личных целях: проследить за своей женой, девушкой или любым другим произвольным человеком, который не совершил никакого преступления (как развлекались агенты АНБ, просматривая фотографии с веб-камер невинных девушек). Вероятно, доступ к распознаванию лиц должен быть строго ограничен: только для конкретных единичных операций по судебному ордеру.
Сейчас доступ к системе городского наблюдения имеют около 16 тыс. пользователей — это сотрудники правоохранительных органов, государственных и муниципальных организаций. 10 тыс. сотрудников органов исполнительной власти и 6 тыс. представителей правоохранительных органов могут просматривать видео в реальном времени и изучать архивы записей на рабочих местах и с мобильных устройств. У каждого из них свой уровень доступа, что «позволяет сохранить конфиденциальность жителей города», сказали в департаменте информационных технологий Москвы.
Насколько качественно сохраняется конфиденциальность граждан РФ — хорошо видно по активности на форумах, где происходит торговля персональными данными россиян.
Любой желающий может заказать пробив данных владельца по номеру телефона: ФИО, паспортные данные, адрес. Можно купить отслеживание местоположения человека по вышкам сотовой связи, история местоположений, детализация звонков, детализацию SMS. Продаётся информация из государственных баз «Магистраль», «Сирена», «Граница», «Мигрант», «Кронос», «Спарк», «Поток», комплексных баз ИБДР-ИБДФ, подробные выписки из банков по счетам физлиц и юрлиц, и так далее.