ПРОЕКТЫ
Фирмы Cognitive Technologies, Hewlett-Packard, LVS, Oracle образовали стратегический "архивный" союз
Произнося слово "архив" каждый из нас представляет примерно одно и то же: характерный запах бумажной пыли, груды книг, папок, документов, разобраться в которых может лишь человек загадочной профессии - архивариус. Бумажные ценности требуют особого ухода, учета и контроля. Чуть ослабишь внимание - пропадет карточка в картотеке, и документ уже не найти. В действительности-то он еще существует, но ссылки утеряны, и добраться до него невозможно. "Мертвый" фонд - страшная болезнь существующих библиотек и крупных архивов. Эту и многие другие проблемы раз и навсегда позволит решить электронный архив.
Вице-президент LVS Михаил Сидоренко и генеральный менеджер
Oracle СНГ Йован Марьянович: “Видим, видит радужные перспективы”
Совместный проект четырех фирм - Cognitive Technologies, Hewlett-Packard, LVS и Oracle - первая на российском рынке система электронной архивации для корпораций, действующий прототип которой был продемонстрирован 24 октября на семинаре для крупных заказчиков.
Распределение ролей участников проекта | |
Cognitive Technologie | Создание подсистемы архивации: сканирование, распознавание текста, полнотекстовое и атрибутивное (ручное) индексирование документа, экспорт в базу данных |
Hewllett- Packard | Оборудование для построения системы: сервер HP 9000, клиентские машины на процессорах i488, сетевые серверы HP NetServer, сканеры, принтеры, оптические дисководы с автоматической сменой дисков HP SureStore |
LVS | Интеграция всех компонентов системы и техническая поддержка |
Oracle | Поставка СУБД Oracle и средств разработки доступак данным |
Работа по созданию базовой системы ведется около полугода, и к настоящему моменту завершен пилотный проект (в старой терминологии - опытно-конструкторская разработка). По существу, необходимо предоставить некоторый набор универсальных модулей, с помощью которых можно быстро построить электронный архив, соответствующий требованиям конкретного заказчика. Однако, как было подчеркнуто на пресс-конференции, прошедшей в рамках семинара, архивная система - это всегда “индивидуальный пошив”, “костюмчик на заказ”. Поэтому особенно важно, чтобы кто-то нес ответственность за работоспособность “груды железа” и установленного ПО. Этот груз взяла на свои плечи фирма LVS.
Интереснейшим элементом архивного комплеса является Oracle TextServer (входящий в Oracle Media Server) - продукт, ориентированный на хранение, смысловой анализ и поиск текстовых документов в базах данных большого объема. В нем содержится лингвистический анализатор Context. Эта утилита обеспечивает построение поискового образа документа - выделение понятий и полнотекстовую индексацию документа, приведенного к нормализованному виду (создание списка всех встретившихся слов со ссылкой на имена документов). Нормализация русского текста подразумевает его морфологический и синтаксический анализ - приведение к начальной форме всех существительных, прилагательных и глаголов. Нормализация позволяет сократить объем индексных файлов в 5 раз.
Context обеспечивает автоматическую рубрикацию документов, сжатие текстов для быстрого чтения, поиск по адресам и именам и многие другие полезные вещи. Очевидно, что Context - зависимая от языка часть пакета TextServer, требующая локализации. Эту задачу взялась выполнить фирма Cognitive Technologies (недавно был подписан договор с Oracle (см. PC Week/RE, №16/95, с. 60). По словам официальных представителей компании, у нее есть собственные разработки, реализующие все аналогичные функции и уже используемые в готовящемся к выходу на рынок продукте “Евфрат”. В тех проектах по построению архивов, которые выполняются уже сейчас, будут применены именно эти технологии. А по мере локализации утилиты Context у заказчика появится возможность выбора.
Следует отметить, что электронный архив - всего лишь часть (хотя и ключевая) комплекса, именуемого системой управления электронными документами (СУЭД) с такими основными функциями, как сканирование документов, распознавание и редактирование текста, создание электронных документов и их образов, работа с архивом, просмотр и пересылка документов по локальным и глобальным сетям, управление потоком работ.
Поэтому думать об организации электронного архива имеет смысл лишь тогда, когда все предприятие уже полностью перешло на электронный документооборот, а не ограничилось локальными островками автоматизации в разных отделах. Приведенная на пресс-конференции цифра - 12 заказов на систему электронного архивирования, по всей видимости, и свидетельствует о количестве организаций, которые сегодня реально готовы ее внедрить. Для большинства же предприятий это по-прежнему завтрашний, а то и послезавтрашний день.
Предлагаемая технология рассчитана, по словам технических специалистов, на длительное хранение документов - от 50 до 100 лет, именно поэтому в ней используются такие “долгоиграющие” носители, как диски CD-ROM, магнитооптические диски с перезаписью и т. п. Kак прозвучало в речи выступавших, время, требуемое на внедрение этой технологии для архива среднего размера, - 3-9 месяцев (с учетом обучения персонала). K нему надо добавить время, затрачиваемое на наполнение архива специальными словарями, рубрикаторами и другими необходимыми элементами.
Один из участников семинара -начальник отдела АСУ Центрального телеграфа Сергей Лебедев так определил свой интерес к архивным системам:
“Я согласен с вице-президентом LVS Михаилом Сидоренко в том, что документооборот - это кровь большого предприятия. Его неправильная организация влечет за собой основные потери времени, пропажу документов. Например, наш телеграф насчитывает около 2000 сотрудников, имеет три-четыре уровня административной иерархии, тысячи клиентов. У нас довольно сложный документооборот, который пока ведется вручную. Чтобы получить справку из архива, иногда приходится ждать больше недели, и не всегда с положительным результатом. Мы второй год работаем с LVS над созданием системы управления электронными документами, и нам бы очень хотелось, чтобы электронный архив стал ее частью”.
ЕЛЕНА МОНАХОВА