В версию 8.1 ПО ABBYY FineReader Engine — инструментария разработчика (SDK), позволяющего реализовывать функции распознавания текстов и обработки документов — добавлена поддержка иврита и тайского языка, а также нового архивного формата PDF/Archive (стандарт ISO 19005-1:2005 рекомендует его для задач длительного хранения документов). Таким образом, ABBYY FineReader Engine 8.1 стал первым продуктом, реализующим в рамках одного SDK распознавание текстов на 191 языке на базе латиницы, кириллицы, армянского, греческого, еврейского и тайского алфавитов, а также японских, корейских и китайских иероглифов. Очередное усовершенствование данного продукта открывает для компании ABBYY выход на новые рынки Ближнего Востока и Юго-Восточной Азии.
По оценкам ABBYY, во всем мире иврит и тайский язык используют около 80 млн. человек. При этом, как утверждают разработчики, достоверность распознавания тайского у ABBYY FineReader Engine 8.1 на 50% выше, чем у конкурирующих продуктов.
Одна из трудностей заключается в том, что в тайском тексте слова пишутся слитно, без пробелов, а буквы и диакритические (дополнительные) знаки могут располагаться в строке на четырёх различных уровнях. В иврите же используется “обратное” направление письма (справа налево), но в тех случаях, когда в тексте попадаются слова на другом языке, например, на английском, они пишутся слева направо.
“Для того чтобы включить в список поддерживаемых языков распознавания тайский и иврит, нам пришлось решить ряд специфических и довольно сложных задач, — отметил главный менеджер ABBYY по технологическим продуктам Александр Рылов. — Однако мы успешно справились с ними — научили FineReader Engine разбирать многоуровневую диакритику и правильно интерпретировать смешанные тексты с двунаправленным чтением (к примеру, иврито-английские). Полагаю, что партнеры оценят наш новый продукт и будут активно использовать его в проектах по обработке различных документов на тайском и иврите, включая типичные архивные задачи и задачи, связанные с извлечением данных”.
Кроме того, в версии 8.1 продукта ABBYY FineReader Engine появилась возможность сохранять в форматах PDF и RTF документы на японском, китайском и корейском языках с вертикальным расположением текста и сложной версткой.
Генеральный директор “ABBYY Россия” Григорий Липич отмечает, что предусмотрено два способа лицензирования данного SDK. Лицензия на разработку даёт разработчику право встраивать ABBYY FineReader Engine в своё приложение. Пользовательская же лицензия позволяет работать с компонентами ABBYY FineReader Engine, встроенными в приложение разработчика. Возможно также приобретение не всего инструментария, а лишь отдельных модулей, реализующих те или иные функциональные возможности SDK.