Сфера применения в корпоративных системах технологий распознавания при преобразовании бумажных документов в электронный вид уже давно вышла за пределы автоматизации отдельных рабочих мест. В современных условиях выполнение таких операций зачастую требуется от самых различных категорий пользователей, в сочетании с работой многих других приложений. Короче говоря, встает задача интеграции OCR-средства в КИС предприятия, что сделать с помощью традиционных настольных продуктов бывает совсем не просто.
Отвечая на подобные потребности заказчиков, компания ABBYY выпустила новый серверный продукт ABBYY Recognition Server 1.0, предназначенный для распознавания документов и PDF-файлов. Он может использоваться как самостоятельное решение, а также интегрироваться с другими приложениями. По мнению разработчиков, его автономное применение целесообразно на средних и крупных предприятиях, где объёмы обрабатываемых документов составляют несколько сотен страниц в день и даже более. В интегрированном виде ABBYY Recognition Server может работать в составе систем электронного документооборота, потокового ввода документов, электронных архивов, баз знаний, систем пресс-клиппинга, программ для обработки входящей почты и факсов.
Серверная архитектура продукта позволит организациям сократить ИТ-расходы: больше не нужно устанавливать и поддерживать отдельные компоненты распознавания текстов на рабочих станциях пользователей, снижаются требования к вычислительным мощностям рабочих станций (вся ресурсоемкая обработка изображений ведется на сервере), уменьшаются затраты на обучение пользователей (продукт работает в полностью автоматическом режиме по сценариям, заранее настроенным в соответствии с бизнес-процессами организации).
ABBYY Recognition Server 1.0 построен на базе технологического ядра ABBYY FineReader, в котором реализовано распознавание печатного текста на 187 языках, а также 15 типов штрихкодов. Результаты распознавания сохраняются в формате PDF с возможностью полнотекстового поиска и в форматах XML, DOC, XLS, DBF. Система предусматривает детальную настройку всех этапов обработки, от поиска и открытия исходных изображений до сохранения результатов. Распознавание и обработка изображений ведётся автоматически, в соответствии с заданным расписанием, либо инициируется вручную администратором системы. Входящие документы принимаются в виде графических (TIFF, JPEG, JPEG 2000 и др.) или PDF-файлов из папок в локальной сети либо с FTP-серверов. Кроме того, документы могут быть получены от сетевых сканеров или многофункциональных устройств. Для разработчиков корпоративных решений предусмотрена возможность управления всеми параметрами работы ABBYY Recognition Server с помощью средств XML-описаний, в том числе из внешних приложений через открытый набор API. Масштабируемость продукта помимо прочего обеспечивается путём распределенной обработки задач на нескольких компьютерах, а также поддержкой многопроцессорных и многоядерных архитектур.
Для продукта на территории России предусмотрено три типа лицензирования ABBYY Recognition Server: по количеству процессоров, по количеству документов, по объему обрабатываемых страниц. Последний вариант предназначен для сервисных бюро — организаций, которые предоставляют услуги ввода, распознавания и конвертации документов на коммерческой основе.