ПРОЕКТЫ

Контракт, согласно которому компания КРОК (www.croc.ru) должна была создать для Госкомстата программно-аппаратный комплекс первичной обработки материалов Всероссийской переписи населения 2002 г., вышел в свое время на первые полосы средств массовой информации из-за судебного иска, поданного конкурентом КРОКа - фирмой ABBYY (см. PC Week/RE, N 33/2002, с. 8). Теперь, когда первичная обработка переписных листов завершена, можно в более спокойной обстановке подвести некоторые итоги.

Владимиру Соколину (слева) и Борису Бобровникову при выполнении проекта

приходилось преодолевать не только технические, но и юридические трудности

Как сообщил на пресс-конференции председатель Госкомстата Владимир Соколин, его ведомство полностью удовлетворено работой программно-аппаратного комплекса, а созданная КРОКом технология принята на вооружение региональными статистическими органами и получила статус базовой. По словам г-на Соколина, это был первый в стране опыт по автоматизации переписи населения. Всего на проведение столь важного мероприятия из госбюджета было выделено около 5 млрд. руб. По нашим оценкам, примерно десятая часть указанной суммы пошла на создание автоматизированной системы обработки результатов. Стоимость услуг КРОКа (сюда не включены поставки аппаратных средств), как заявил генеральный директор компании Борис Бобровников, составила 51,5 млн. руб.

Специально для данного проекта специалистами КРОКа были разработаны алгоритмы высокоскоростного оптического распознавания бланков ручного заполнения. С помощью этих алгоритмов на стандартном офисном ПК удается обрабатывать 150-200 двухсторонних бланков в минуту, что позволяет применять высокопроизводительные сканеры. Кроме того, совместно с НПО КСИ и фирмой "Окрус" был спроектирован и запущен в производство сканер ДС300, способный сканировать до 150 двухсторонних документов в минуту. Созданная КРОКом система "Свод М1" автоматизирует весь технологический цикл, от проектирования машиночитаемых документов и задания правил формального и логического контроля заполняемых полей до сохранения полученной информации в БД (ее объем в конечном итоге составил 283 Гб). В связи с конфиденциальностью части сведений, содержащихся на бланках переписи, требовалось обеспечить информационную безопасность обработки данных и сертифицировать ее в Гостехкомиссии.

Программно-технические комплексы перед поставкой в 65 региональных центров обработки собирались и полностью тестировались в Москве. Это позволяло вводить их в эксплуатацию через одну-две недели после доставки. Всего в этих центрах и в ГМЦ Госкомстата было установлено 106 Intel-серверов Compaq, 108 сканеров (63 - ДС300 и 45 - Fujitsu) и 1557 рабочих станций. В 16 центрах развертывались ЛС. Все время, пока шла обработка бланков, действовала круглосуточная "горячая" линия. Были предусмотрены также централизованные процедуры разработки дополнительных функций и распространения обновлений.

Обработка бланков началась в феврале 2003 г. и была полностью завершена к концу июля, причем процедура сканирования и распознавания всех документов (150 млн. единиц) заняла всего три месяца, а остальное время ушло на формальный и логический контроль, позволяющий отделять заведомо подозрительные бланки и передавать их на ручное считывание. По оценкам специалистов Госкомстата, в среднем фиксировалось менее одной ошибки на тысячу введенных знаков.

Что же дала автоматизация? Если сравнить с прошлой переписью населения, то выигрыш во времени обработки бланков не очень велик: тогда на это потребовалось восемь месяцев, а сейчас - шесть. Но, по мнению г-на Соколина, точность и достоверность полученной информации сегодня, несомненно, выше. Непонятно, впрочем, стоило ли так спешить: обработка собранных данных задерживается из-за проблем с предназначенным для этого программным обеспечением. А они, в свою очередь, связаны, считает глава Госкомстата, с несовершенной системой бюджетного финансирования, когда на многолетние программы средства выделяются порциями в рамках годовых бюджетов. "Иногда, - посетовал он, - КРОКу приходилось по сути кредитовать государственную организацию".

Внедренному программно-аппаратному комплексу не суждено простаивать без дела: у Госкомстата есть обширные планы проведения как местных, так и общефедеральных обследований. В числе последних - сельскохозяйственная и экономическая переписи.

Версия для печати