В ходе переписи населения в Таджикистане с помощью ABBYY FlexiCapture было обработано 13 млн бланков

Компания ABBYY объявила о завершении ввода и обработки бланков с помощью системы ABBYY FlexiCapture в ходе переписи населения и жилищного фонда Республики Таджикистан.

Успешное внедрение решения ABBYY позволило снять с операторов необходимость ручного набора текста, оставив только задачу контролировать правильность ввода данных. Если раньше, при ручном методе, один оператор вводил в день по 200 бланков, то при использовании системы ABBYY FlexiCapture этот показатель возрос до 1500. В результате ввод и обработка информации в процессе второй переписи населения в Таджикистане составили 7 месяцев, по сравнению с предыдущей переписью, когда тот же объем работ при ручном вводе данных занял 18 месяцев. Кроме того, увеличилась достоверность информации, а ошибок стало в 20 раз меньше, чем при ручном методе. Теперь обработанные данные хранятся в электронном виде в архиве.

Центральным статистическим органом Таджикистана является Агентство по статистике при президенте Республики, ответственное за проведение переписей населения, обследований домохозяйств, демографическую статистику и другое.

В ходе первой переписи населения Таджикистана в 2000 г. данные обрабатывались вручную. Такой метод оказался малоэффективным – только на ввод всего объема информации потребовалось более полутора лет, и качество обработки оставляло желать лучшего.

Учитывая этот опыт и планируя проведение второй переписи населения, в Агентстве по статистике посчитали необходимым воспользоваться решением по автоматизированному вводу информации с бланков путем их сканирования и автоматического распознавания.

Подготовка проекта началась за несколько лет до старта кампании. В 2008 г. с использованием ABBYY FormReader была осуществлена пробная перепись населения. Для основного этапа переписи в Таджикистане выбрали следующую версию ABBYY FormReader – систему ABBYY FlexiCapture. Это решение оптимально для проведения такого крупного проекта как перепись населения Республики, когда ежедневно надо обрабатывать сотни тысяч документов, и в процесс вовлечены десятки операторов.

Сотрудники Агентства и специалисты из ABBYY отладили общую систему обработки данных – от регистрации портфелей переписчиков до создания выходных статистических таблиц. Так было подготовлено более 200 рабочих мест для кодировщиков и операторов, налажено взаимодействие с существующей инфраструктурой и базами данных, проведено обучение временного персонала. Особое внимание уделили созданию дополнительных алгоритмов и правил для повторной проверки заполнения данных на бланках и их комплектности.

Вторая национальная перепись населения и жилищного фонда Республики Таджикистан проходит в несколько этапов при финансировании из средств государственного бюджета, при поддержке «Всемирного Банка» и под эгидой фонда ООН в области народонаселения (ЮНФПА). C 21 по 30 сентября 2010 г. состоялся обход домохозяйств и заполнение бланков переписи. Далее следовал этап сбора и подготовки бланков к обработке.

Непосредственно сканирование и ввод данных начали в феврале и полностью закончили в сентябре 2011 г. В результате уже на этапе ввода данных система ABBYY FlexiCapture позволила сократить до минимума количество ошибок, вызванных неправильным заполнением бланков, и при необходимости в короткие сроки найти копии переписных листов. Специально для этого проекта специалистами ABBYY было разработано 10 видов бланков на двух языках – русском и таджикском.

В настоящий момент проходит этап статистической обработки результатов переписи.

«При выборе подрядчика мы остановились на ABBYY, потому что в этой компании нам не только предложили программный комплекс для качественной обработки данных переписи населения Таджикистана и поделились опытом аналогичных проектов, но и обеспечили полную техническую поддержку всего проекта, – говорит Бахтия Мухаммадиева, директор Агентства статистики при президенте Республики Таджикистан. – Эффект от внедрения системы оказался впечатляющим – нам удалось в кратчайшие сроки и с минимальными затратами завершить обработку 13 млн односторонних и двусторонних бланков, получив достоверные и полные данные».

©  CNews