Классическая задача по автоматизации — дать организации или подразделению удобный инструмент для документационного обеспечения функциональных процессов. Для органа власти, распоряжающегося имуществом региона или муниципалитета, создание такого инструмента предполагает оцифровку изрядного количества документов и предоставление специалистам доступа к информации из них и самим документам. Эффективность сервиса напрямую зависит от того, насколько он будет заточен под заказчика и повернут к нему, что называется, лицом.

Классика жанра

Какие системы сегодня применяются для автоматизации документационного обеспечения деятельности и принятия решений в процессах управления и распоряжения земельно-имущественный комплексом (ЗИК) в регионе или муниципалитете? На ум приходят, конечно же, два класса систем — СЭД и ЕСM.

СЭД ориентированы не столько на аккумулирование и предоставление доступа к документам, сколько на оперативную работу во время активного жизненного цикла документа или пакета документов. ЕСМ — на управление контентом. У корпорации ЭЛАР большой опыт создания и внедрения систем документационного обеспечения деятельности государственных органов на базе ECM-платформ. Такие системы позволяют без установки дополнительных программных компонентов в полном объеме реализовать следующие функции:

  • хранение образов бумажных документов, электронных документов и атрибутивной информации (электронные карточки), полнотекстовых данных;
  • поиск и доступ к документам, просмотр найденных данных, печать, выгрузка образов в MS Word, сохранение образов документа на внешнем носителе (для возможности отправки по запросам);
  • залповый и текущий ввод документов в систему;
  • администрирование и управление доступом (ведение учетных записей пользователей и групп, аутентификация при входе в систему, управление правами доступа);
  • взаимодействие с внешними информационными системами (Web-сервисы, API).

С точки зрения пользователя система, как правило, представляет собой банк данных документов с поисковой формой, с помощью которой при вводе набора реквизитов можно получить результат в виде одного или нескольких документов, соответствующих запросу. Для разных массивов документов конструируются разные поисковые формы, подстроенные под набор индексных полей. Документы могут быть проиндексированы по минимальному количеству полей, например для поиска по номеру, или же будет проведено полное индексирование для осуществления сквозного поиска.

Индексирование vs. Анализ

Теперь представим себе типичную для российских регионов ситуацию. Администрации N-й области необходим инструмент для организации более эффективных процессов контроля, управления и распоряжения имуществом и земельными участками, в первую очередь процедур, связанных с арендой. Мотивация для поиска такого инструмента у администрации и, в частности, органа управления ЗИК очень прозрачная — финансовая. Что может предложить администрации N-й области ИТ-рынок?

Экспертизу и консалтинг в первую очередь, в рамках которых осуществляется анализ макропроцессов органа управления имуществом региона, т. е. деятельности каждого подразделения: отделов аренды, ведения реестра, корпоративных отношений и т. п. Затем проводится анализ многих и многих типов документов — правоустанавливающих и правоудостоверяющих, договоров аренды и имущества, приватизационных и инвентаризационных дел, профильной организационно-распорядительной документации. Как правило, в таких ситуациях принимается решение о создании цифрового информационного ресурса, состоящего из индексной базы данных и электронных образов документов, и внедрении системы электронного архива. Однако, если рассмотреть потребности органа управления имуществом с близкого расстояния, события могут развиваться иначе. Итак...

Орган управления имуществом N-й области оказался «счастливым» обладателем массива в 17 млн. документов 30-ти различных типов, создававшихся в течение долгого времени. Массив востребован различными подразделениями для решения множества задач. Кроме того, будут возникать новые рабочие процессы, требующие каких-то иных подходов к формированию подборок документов. Это значит, что при формировании информационного ресурса необходимо спрогнозировать некий оптимальный набор индексных полей, что крайне сложно, — архив документов можно сделать универсальным только при условии избыточного индексирования. Автоматическое распознавание никогда не даст стопроцентного результата по документам хорошего качества, а при условии, например, угасающих текстов, упадет до 80%. При таких обстоятельствах администрации N-й области придется создать у себя полноценный центр оцифровки и постоянно заниматься адаптацией процесса ретроконверсии документов.

Однако задача органа управления имуществом должна быть решена таким образом, чтобы свести к минимуму расходы на индексирование и сократить время, потраченное на этот процесс. Документы должны автоматически отбираться и оперативно консолидироваться в рамках рабочего места конкретного функционального специалиста. Так существует ли другой путь, тем более, что полноценный центр оцифровки в региональной администрации — идея по своей сути утопичная? Да, существует, если вовлечь в концепцию управления контентом знания о закономерностях документационного обеспечения деятельности, аналитические технологии и соединить все это в одном решении, создав автоматизированную систему подборки документов (АСПД).

Как работает?

Неструктурированный цифровой массив в виде скан-образов 17 млн. документов загружается в систему, которая осуществляет черновое распознавание без верификации. Затем АСПД по заданным классификаторам и набору регулярных выражений определяет принадлежность документа к определенному типу. Для каждого из 30 типов документов запрограммирован набор реквизитов, необходимых для включения на их основе в оперативные подборки, и из документов на основании той же распознанной подложки извлекаются индексные данные и связываются с документами. Наименования документов не формализованы, и система распознает близкие по значению слова, например «договор», «контракт», «соглашение».

Система взаимодействует через программный интерфейс (API) с любым источником, содержащим документы, — СЭД, ECM, файловой системой. Технология обработки информации позволяет определять словоформы, выявлять различные сущности в тексте (производится с использованием словарей и/или правил употребления слов, например с большой вероятностью слово с заглавной буквы, стоящее после аббревиатуры ОАО, является названием организации): наименование организаций, название улиц, номера домов и т. д.

Если бумажным прототипом массива был набор папок (номенклатурных дел), то единицей обработки в АСПД будет дело. При определении типа страницы, система делает логическую «закладку» с привязанными к ней параметрами этого документа и выделенными индексными полями, которая, по сути, является карточкой документа, отмеченного этой «закладкой».

Неструктурированный массив в результате обработки системой превращается в формализованный электронный информационный ресурс. В результате запроса, который осуществляется в универсальном поисковом поле, система самостоятельно распознает формат и содержание запроса, проассоциирует их с адресом или наименованием юридического лица, кадастровым или условным номером и датой договора аренды. На интерфейсе рабочего места пользователя помимо строки поиска будет всего три кнопки — «Документы по аренде», «Документы на объект» и «Арендатор». Специалисты смогут оперативно формировать подборки документов по наименованию юридического лица, фрагменту адреса нахождения объекта, условного или кадастрового номера, номера договора аренды. Всякий раз, когда у подразделения администрации появится необходимость наполнить систему новыми документами, они после оцифровки будут также автоматически обрабатываться и окажутся включенными в процессы обеспечения деятельности отделов.

Помимо 30 типов формализованных документов, массив содержит также сопутствующие квитанции об отправке заказных писем, судебные уведомления и т. д. Создавать глобальный справочник, учитывая и эти типы документов, нецелесообразно. Расставленные закладки дают возможность осуществлять прямой доступ к документу, а просмотрщик — «пролистать» не только этот документ, но и близкие к нему.

Таким образом, АСПД позволяет решать не только типовые задачи, но и любые новые, становясь универсальным инструментом управления земельно-имущественным комплексом региона или муниципалитета.

СПЕЦПРОЕКТ КОРПОРАЦИИ ЭЛАР