Адские условия: Самый суровый краш-тест технологии распознавания паспорта

Как вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и надежности нашей технологии доверяют лидеры цифровой трансформации: госведомства, ведущие банки, аэропорты, промышленность и бизнес. Мы ценим доверие наших клиентов, а для вас, дорогие читатели, решили наглядно показать эффективность наших систем. Так сказать, лучше один раз увидеть, чем сто раз услышать. Летс гоу!

Красиво. Ритмично. Технологично

Для начала обрисуем современную ситуацию с распознаванием паспорта. Помните наш пост об истории распознавания паспорта РФ? Если нет — очень рекомендуем. Так вот сегодня к системам распознавания удостоверяющих личность документов, главным из которых является наш паспорт, предъявляются максимально строгие технологические требования. В первую очередь это объясняется тем, что удостоверения личности содержат всю основную информацию о человеке и по сути подтверждают, что предъявивший документ гражданин является самим собой. Потому уметь верно обращаться с такими данными — это не просто полезно, а буквально необходимо. Без возражений.

Кроме того, удостоверения личности выполняются на бланках государственного образца и серьезно защищены: речь о гильошированном фоне и голографических элементах, которые затрудняют распознавание. А еще — до сих пор в ходу паспорта РФ рукописного заполнения с далеко не всегда понятным почерком. Чтобы быстро и безошибочно извлекать текст из такого сложного документа, как паспорт, искусственный интеллект должен быть действительно «умным».

Дубликат бесценного груза: История распознавания паспорта РФ от нулевых до наших дней

Программы распознавания данных удостоверений личности появились не так уж и давно — всего пару десят…

habr.com

Также крайне важно, чтобы не только сам процесс, но и результаты распознавания были «объяснимыми». Иначе говоря, система должна иметь индикацию степени уверенности, а пользователь — иметь возможность при необходимости отследить проблемное место вплоть до символа. О том, почему весь научный мир считает объяснимость ключевым критерием для современных систем оптического распознавания символов (OCR), мы уже рассказывали в этом материале.

Качество распознавания не должно изменяться в зависимости от устройства. Сегодня технология активно используется не только на сервере, но и в мобильных приложениях и даже в браузере, а документы распознаются на фотографиях и в видеопотоке (мы сделали это аж в 2015 году). Такой системе должны быть нипочем блики, неравномерное освещение, искажение пропорций, смазывание из-за тряски камеры. А еще — механические повреждения, неаккуратное заполнение и тому подобное. И разумеется нельзя не упомянуть, что ни при каких обстоятельствах изображения документов и данные из них не должны направляться третьим лицам для обработки вручную. Иначе это уже не искусственный интеллект, а полное дно, товарищи. 

В общем, чтобы действительно считаться современной и эффективной, система распознавания паспорта РФ просто обязана удовлетворять всем перечисленным выше критериям и функционировать в любых, даже совершенно адских условиях. Программные решения для распознавания паспорта РФ от Smart Engines такое могут, умеют и регулярно практикуют. Желаете доказательств? — их есть у меня!

Книжка паспорта целиком

Здесь мы продемонстрируем работу нашей системы при нормальном освещении. Как говорится, — просто чтоб было. Распознавать паспорт в видеопотоке будем целой книжкой, то есть в открытом виде. На развороте с фото находится самая важная информация.

Распознавание российского паспорта у технологии Smart Engines заняло меньше секунды. Представляем результаты вашему вниманию:

Распознавание прошло успешно (впрочем, никто и не сомневался). Самые внимательные могут сравнить данные MRZ.

Распознавание прошло успешно (впрочем, никто и не сомневался). Самые внимательные могут сравнить данные MRZ.

Итоги распознавания как на ладони — зеленые индикаторы свидетельствуют о том, что искусственный интеллект абсолютно уверен в точности своих результатов. Также обратим внимание, что возвращенные текстовые данные были распознаны совершенно независимо друг от друга. То есть имя, фамилия и отчество извлекались из соответствующих полей паспорта, а не «подтягивались» из машиночитаемой зоны с последующим переводом на русский.

Останавливаться здесь не на чем, идем дальше.

Распознавание при низкой освещенности

Темнота — друг молодежи, а вот для большинства систем оптического распознавания, увы, не особо. И чем ниже освещенность, тем сложнее OCR найти и извлечь паспортные данные. Конечно, сегодня эта проблема частично компенсируется возможностями камер на топовых смартфонах, однако и они вывозят ситуацию далеко не во всех случаях.

В рамках второго испытания паспорт дорогого Имярека оказался заброшен глубоко под стол. Бонусом — дополнительное затемнение от смятых страниц.

Тоже успешно. Наша система безошибочно распознала все поля паспорта.

Тоже успешно. Наша система безошибочно распознала все поля паспорта.

Заметьте, насколько хуже становятся видны буквы в паспорте при темноте. Если на белом фоне машиночитаемой зоны символы еще можно отчетливо различить, то в случае с полем «Паспорт выдан:» все довольно-таки непросто. Непросто всем, кроме Smart Engines. Продолжаем!

Проективные искажения

Если вы распознаете паспорт на фотографиях или в видеопотоке, а не со сканера (а так и происходит в большинстве повседневных ситуаций), то этот кейс про вас. Скорее всего человек держит документ в одной руке, а другой наводит на него камеру смартфона. В таких обстоятельствах держать паспорт идеально ровно, параллельно устройству, да еще и в полностью развернутом виде — не каждому под силу. Как и избежать тряски, чтобы добиться полной статики изображения.

Какие сложности это добавляет? Пожалуй, самое очевидное — блики. Из-за глянцевой поверхности третьей страницы паспорта процесс распознавание может затруднить появление (и перемещение) отражений, перекрывающих необходимые данные. А еще возникает искажение пропорций: полусложенный или повернутый паспорт создает еще одно непреодолимое препятствие для многих OCR. Кроме нашей!

Пришло время проверить в этом деле технологию Smart Engines. Результаты перед вами:

Взгляните на самые дальние цифры MRZ - увидеть их человеку уже не так просто. А вот ИИ отлично справился.

Взгляните на самые дальние цифры MRZ — увидеть их человеку уже не так просто. А вот ИИ отлично справился.

Искусственный интеллект моментально нашел текстовые данные и все безошибочно распознал. Мы решили пойти дальше и для пущей наглядности показать паспорт другим боком — так, чтобы на страницы падала тень. И вдобавок сложить паспорт чуть ли не под 45 градусов.

Итог: распознавание — мгновенное, результат — ошеломительный. Судите сами:

Тут паспортные данные оказались еще и не на свету. Но нашу систему такое не колышет.

Тут паспортные данные оказались еще и не на свету. Но нашу систему такое не колышет.

В общем, и это испытание пройдено успешно. Теперь если вам понадобится ввести данные паспорта «на бегу», вы знаете, к кому обратиться. А мы идем дальше.

Рукописный паспорт

Для этого теста мы подготовили паспорт, заполненный от руки. Хочется, чтобы такие документы распознавались ничуть не хуже — с паспортом не шутят. В противном случае использование некачественной технологии, которой не под силу распознавание рукописного паспорта, фактически «отсекает» часть клиентов. Надо ли оно заказчику — вопрос риторический.

Загвоздка для системы распознавания здесь в том, что печатный шрифт не видоизменяется от паспорта к паспорту, а вот рукописные образцы — друг другу рознь. И хотя такие документы, как правило, стараются заполнять аккуратно, некоторые из них откровенно заводят в тупик. 

Мы решили попытаться «скормить» один из таких образцов системе Smart Engines. И вот результат:

С рукописным заполнением паспорта ИИ справился на ура.

С рукописным заполнением паспорта ИИ справился на ура.

Никаких проблем у нашей технологии это не вызвало, а процесс как всегда занял мгновение. Но это еще ладно. Давайте усложним ситуацию: снова напустим тень и добавим щепотку проективных искажений:

От угла раскрытия паспорта качество распознавания не изменилось. А это всегда приятно.

От угла раскрытия паспорта качество распознавания не изменилось. А это всегда приятно.

Вывод: стабильность работы системы Smart Engines подтверждена, испытание пройдено! Впрочем, ничего удивительного, ведь в ходе обучения наших моделей мы познакомились со всей вариативностью начертаний кириллических букв. И научили наши нейросети правильно понимать их: и при свете, и в тени, и при наличии искажений. 

А пока мы формировали обучающий датасет — познали все муки учителей, проверяющих прописи. Читайте здесь, как это было. А мы продолжаем нашу экзекуцию.

Комбинируем условия 

Продолжаем эксперименты, мы решили пойти во все тяжкие и совместить все как можно больше условий в одном испытании. 

Полузакрытая книжка паспорта при невысокой освещенности? Пожалуйста:

61a3a0672de0f917b0854abe1ee180ac.png

Распознавание согнутого паспорта в полном кадре с неоднородным фоном? Проще не бывает:

42f6641aaa5b4f8d168a7795b27e6123.png

Распознавание проективно искаженной книжки паспорта рукописного заполнения в темноте? Ответ вы знаете:  

6aa1417445d2e2f6d6c531e07279dd50.png

Распознавание паспорта в условиях дискотеки — с меняющимся светом и бегающими тенями? Аналогично:

5d4f379166315eca916f5e21de7bdb86.png

Полный ад (тусклая лампочка от системника) — тоже не помеха:

0b3de843b79bc068121439cc18b49980.png

Можно выдыхать: технологии Smart Engines не страшны никакие условия.

Делайте выводы!

Ультрахард: Паспорт +1

А вы знали, что ПО Smart Engines умеет распознавать и извлекать данные сразу нескольких документов на фотографиях и сканах, в том числе разного вида и любой конфигурации? Называется этот процесс мультиобъектным распознаванием. И охватывает он почти все главные документы: общегражданский паспорт РФ, СНИЛС, водительское удостоверение и другие.

Одновременно можно просканировать и распознать любое количество документов — достаточно расположить их в одном кадре и сделать снимок.

Проверим на паспортах? Конечно! Какие вопросы?

05bf10d10ea410b2fcae7f2d487d1eab.png

На этом моменте наши идеи «адских» условий распознавания подошли к концу. Но мы с удовольствием протестируем нашу OCR еще сколько угодно раз. И регулярно этим занимаемся, непрерывно совершенствуя технологию.

На сегодняшний день система Smart Engines способна мгновенно распознавать данные всех страниц паспорта, включая прописку. А еще — читать 2787 типов удостоверяющих документов 235 юрисдикций мира и 4467 шаблонов. Мы предлагаем надежный искусственный интеллект, который обеспечивает самое быстрое и точное распознавание паспорта. Технология Smart Engines без проблем распознает рукописные паспорта, главный разворот, прописку, все страницы, штампы, постранично или «книжечкой» на фото, сканах и видео. И все это — в контуре заказчика, без риска утечки персональных данных.

Решение легкоинтегрируется в мобильные, веб, десктоп и серверные приложения. Время распознавания кадра на смартфоне составляет 0.15 секунды, а на 32-х ядерном сервере можно распознавать по 55 разворотов паспорта в секунду.

На этом моменте в лучших традициях телешоу хочется сказать:, а вам слабо? Но мы скажем проще: хотите качественную систему распознавания паспорта, которая будет эффективно функционировать и не подведет вас в критических условиях, — стучитесь в Smart Engines. Вам откроют!

P.S. Все использованные в краш-тесте документы — синтетические.

Какое пиво любит ИИ? Что советуют популярные чат-боты и нравится ли это программистам

Пусть прошлое раскрошится волною о причал, мы вспомним всё хорошее, забудем про печаль. Привет, Хабр…

habr.com

© Habrahabr.ru