Компания ABBYY объявила о выпуске ABBYY Recognition Server 3.5 — высокопроизводительного серверного решения для обработки документов и PDF-файлов, полученных со сканера, факса, МФУ. Результатом работы являются распознанные документы в привычных текстовых форматах: PDF, PDF/A, MS Word и других. Решение имеет широкие возможности интеграции с различными информационными системами; это может быть реализовано при помощи скриптов, XML-запросов, а также посредством API.

В ABBYY Recognition Server 3.5 используется новая версия технологии распознавания. Её возможности:

  • точное воспроизведение форматирования текста и логической структуры исходного документа: взаимного расположения полей, заголовков, таблиц. Это позволяет заметно уменьшить время редактирования распознанного документа, обеспечить наилучший результат при автоматическом распознавании, в ряде случаев полностью исключить этап верификации;
  • высокая точность распознавания арабских текстов (арабская вязь, с её слитным написанием слов и множественными значениями каждого символа, до сегодняшнего дня представляла практически неразрешимую задачу для OCR-систем);
  • качественное распознавание текстов на азербайджанском языке. Этого удалось добиться за счет поддержки азербайджанской морфологии.

Появились новые возможности настройки ABBYY Recognition Server 3.5 на бизнес-процессы пользователя. Так, новая станция сканирования поддерживает индивидуальные пользовательские сценарии, которые могут быть реализованы при помощи скриптов. В частности, можно задать порядок расположения страниц после двустороннего сканирования, выбрать способ разбиения изображений большого формата, указать сразу несколько папок, в которых будут храниться копии отсканированных файлов и пр.

ABBYY Recognition Server автоматически интегрируется с поисковыми серверами Google Search Appliance и Microsoft Office SharePoint Server, давая возможность выполнять полнотекстовый поиск по документам, хранящимся в виде изображений.