Использование технологий DOCS для управления документами

Новый 2002 год Международный общественный фонд социально-экономических и политологических исследований (Горбачев-Фонд) встретил открытием Научно-информационного центра, созданного при поддержке Института “Открытое общество”. Вообще-то основные подразделения НИЦ - библиотека и архив - существовали с момента образования фонда, однако новое название отражает важное качественное изменение в работе центра: отныне его технологическую основу составляет автоматизированная система, построенная компанией “Весть-Метатехнология” на платформе DOCS Open/Fusion (фирма Hummingbird).

Заполнение учетной карточки

Основная задача НИЦ - сбор и обеспечение исследователей материалами по новейшей истории России, главным образом - эпохи перестройки. В архиве центра хранятся уникальные материалы (в том числе видео-, аудио- и фотодокументы), редкие книги и периодические издания, присылаемые из различных стран мира. К ним обращаются исследователи - от студентов до профессоров - не только из России, но и из многих зарубежных государств.

По словам руководителя НИЦ Горбачев-Фонда Сергея Кузнецова вопрос о необходимости автоматизации управления документами был поставлен несколько лет назад, но к его решению удалось приступить только после завершения строительства нового здания фонда в 2000 г. Система должна была обеспечить:

- учет всех типов хранимых материалов;

- учет пользователей;

- создание архива электронных копий материалов и доступ к ним широкого круга пользователей.

При выборе технологической платформы учитывались следующие критерии: масштабируемость, возможность функционального наращивания, наличие технической поддержки и надежность поставщика решения. В результате было принят проект, предложенный компанией “Весть-Метатехнология”. Его реализация началась в конце 2000 г.

Технология создания электронного архива выглядит следующим образом. Все поступающие текстовые печатные документы сканируются программой Fine Reader 5.0 Office, распознаются и сохраняются в виде двух файлов - многостраничного изображения документа в формате TIFF, передающего все особенности исходного документа (включая подписи, печати, резолюции и пометы) и распознанного текстового файла в формате RTF. На каждый документ заводится карточка, к которой прикрепляются оба файла (см. рисунок). Если документ поступает в электронной форме, например по электронной почте, к карточке будет прикреплен только текстовый файл. Сейчас прорабатывается возможность использования формата “двухслойный pdf”, позволяющего сохранять в одном файле изображение документа поверх распознанного текста. На книги также заводятся регистрационные карточки. Книги, как правило, не сканируются, но при необходимости они могут быть обработаны аналогично обычным документам. Просмотр документов в формате TIFF осуществляется с помощью либо встроенных средств системы, либо программы Imaging, входящей в состав Windows.

При вводе в систему фотографий они первоначально сканируются с высоким разрешением, исходный файл записывается на CD-ROM. Затем на его основе изготавливается копия с низким (“экранным”, как правило, 72-100 точек на дюйм) разрешением, она прикрепляется к регистрационной карточке, на которой указывается номер компакт-диска с файлом высокого разрешения. Видеоматериалы оцифровываются и записываются на кассеты DV, регистрационные сведения о ней заносятся в карточку.

Аналогично заводятся карточки на статьи и периодические издания. Сотрудники НИЦ отслеживают профильные статьи в периодических изданиях и в Интернете.

В настоящее время в системе восемь рабочих мест для ввода исходной информации. В электронный вид преобразуются в первую очередь новые поступления, а также по специальному графику выполняется преобразование ранее накопленных документов. По состоянию на декабрь 2001 г. материалы Научно-информационного центра занимают около 1000 погонных метров полок. Наполнение электронной базы данных началось с лета прошлого года, за прошедшие шесть месяцев в нее занесены десятки тысяч документов, описания сотен видеокассет, более тысячи музейных экспонатов, несколько тысяч книг и фотографий.

Онлайновый архив документов хранится в СУБД на базе MS SQL Server 7.0 объемом около 20 Гб, а оцифрованные изображения с большим разрешением - на компакт-дисках. Читатели могут пользоваться различными режимами поиска нужных материалов, а также работать с их электронными вариантами. В настоящее время в читальном зале установлены четыре клиентских компьютера. В течение года планируется подключить к системе всех сотрудников фонда, доведя число рабочих мест до 60. Кроме того, система обеспечивает учет пользователей, работающих с документами, и отслеживает статистику обращения читателей к различным материалам.

Уже на этапе создания пилотного проекта системы пользователи и руководители Горбачев-Фонда (www.gorby.ru) смогли убедиться в эффективности применения современных компьютерных технологий.