ЛИНГВИСТИЧЕСКОЕ ПО

С ABBYY FormReader 6.5 вводить их стало еще легче

В данной заметке под формой понимается документ, заполненный печатными или рукопечатными символами (буквами, цифрами, специальными знаками, метками и т. д.) и предназначенный для сбора определенной информации. Различают структурированные (жесткие) и гибкие формы. В первых геометрические размеры и положение информационных полей постоянны, а во вторых - расположение информационных полей не зафиксировано и может изменяться от экземпляра к экземпляру.

Основу комплексов ввода форм составляют системы интеллектуального распознавания символов (Intelligent Character Recognition, ICR), которые, в свою очередь, строятся на базе систем оптического распознавания текстов (Optical Character Recognition, OCR). ICR-системы отличаются от OCR-cистем тем, что позволяют преобразовывать в электронный вид не только печатные символы, но и рукопечатные, в том числе различные метки - галочки, крестики и т. д.

В мире рынок систем ввода жестких форм (СВЖФ) медленно уменьшается, а систем ввода гибких форм (СВГФ) - стремительно растет. Так, например*1, в США рынок СВЖФ в 2002 г. составлял 92 млн. долл., а его прогноз на 2006-й - лишь 78 млн. долл. В Европе аналогичные показатели составляют 70 и 48 млн. евро соответственно. Что же касается рынка СВГФ, то в США он должен вырасти с 16 млн. долл. в 2002-м до 117 млн. долл. (!) в 2006-м. Аналогичная тенденция наблюдается и в Европе - 36 и 98 млн. евро соответственно.

_____

*1 По данным аналитической компании Strategy Partners (www.strategy-partners.com), опубликованным в 2004 г.

Впрочем, по мнению главного менеджера проекта ABBYY FormReader Арама Пахчаняна, в нашей стране растут оба рынка, как СВЖФ, так и СВГФ. Основные потребители этих систем - банки, страховые, медицинские и образовательные учреждения, маркетинговые агентства и другие организации.

Арам Пахчанян: "Во всем мире

рынок систем ввода гибких

форм стремительно растет!"

Несколько слов об эволюции продукта ABBYY FormReader, который, как уже догадался читатель, является не чем иным, как системой ввода форм. Появление его первой коммерческой версии (она имела номер 4.0*1 и вышла в 1998 г.) было обусловлено в первую очередь потребностями Пенсионного фонда РФ, заинтересованного в быстром вводе огромного количества форм с рукопечатными символами. В 2000-м появилась версия 4.1, в июле 2003 г. - 6.0, а в марте 2005 г. - 6.5.

_____

*1 Номера версий FormReader привязаны к номеру "ядер", используемых при создании соответствующих версий OCR-систем FineReader.

Интересно отметить, что пользователи FormReader’ов четвертой серии не всегда спешат переходить на "шестерку". По словам менеджера по маркетингу головного офиса ABBYY Марины Ступаковой, продукты FormReader версий 4.0 и 4.1 на территории бывшего СССР продолжают успешно использовать примерно 400 предприятий и организаций разных размеров. Хотя распространенность версии 6.0 все же выше: по данным разработчика, данную систему применяют около 600 предприятий и организаций СНГ (среди них есть и такие, где с ее помощью автоматизировано около 300 рабочих мест). Директор по корпоративным проектам "ABBYY Россия" Юрий Корюкин считает, что причина консервативности заказчиков имеет вполне обоснованные психологические и экономические корни: если продукт легок в использовании, обладает необходимой функциональностью, устойчиво работает и легко мигрирует с одной аппаратно-программной платформы на другую, то зачем, спрашивается, его менять?

Чем же версия 6.5 лучше версии 6.0? Прежде всего тем, что в нее добавлен ряд функций, в том числе поддержка новых файловых форматов и возможность подключения новых дополнительных модулей. Кроме того, теперь благодаря технологии FlexiCapture (соответствующий инструментарий может быть поставлен дополнительно) FormReader позволяет обрабатывать в одном сеансе работы как жесткие, так и гибкие формы без предварительной сортировки. Кроме того, новинка способна работать в распределенной сети и допускает настройку через открытый программный интерфейс (API).

Следует также отметить возможность сохранения отсканированных форм в формате PDF и поддержку интерфейса ISIS, в результате чего продукт можно использовать в связке с высокопроизводительными промышленными сканерами. Стоимость систем семейства ABBYY FormReader 6.5 (они поставляются в трех вариантах) практически не отличается от стоимости соответствующих модификаций пакетов версии 6.0.

Одновременно с объявлением о выходе продукта ABBYY FormReader 6.5 (пользователям версии 6.0 он предлагается за 40% от полной стоимости, а пользователям четвертых версий - за 70%) был анонсирован пакет FlexiCapture Studio 1.5, позволяющий в интерактивном режиме создавать (на специальном языке) описания гибких форм, которые понимаются FormReader’ом и, собственно говоря, превращают его из пакета ввода жестких форм в более универсальное средство. Благодаря этим формализованным описаниям FormReader может находить все необходимые поля, даже если их положение на странице варьируется от документа к документу.

Менеджер по маркетингу головного офиса ABBYY Людмила Иваницкая пояснила, что данный продукт является усовершенствованием пакета FlexiCapture Studio 1.0, выпущенного 8 марта прошлого года к выставке СеBIT’2004. Его главное отличие от предшественника состоит в том, что он дает возможность описывать таблицы, которые могут встретиться в гибких формах, и тем самым позволяет FormReader’у точно извлекать информацию из нужных ячеек, что очень важно при обработке счетов и других финансовых документов.

Главные знатоки и "продвигатели" программ cемейства

FormReader: Людмила Иваницкая (cлева),

Юрий Корюкин и Марина Ступакова

По словам Арама Пахчаняна, продвижением программ cемейства FormReader в настоящее время занимаются около 150 системных интеграторов, имеющих статус "партнер ABBYY по корпоративным решениям". Примерно 50 из них работают в России. Знатоки инструментария FlexiCapture Studio (его ориентировочная цена - $3150) имеются примерно на 60 предприятиях. Людмила Иваницкая утверждает, что работа с пакетом FlexiCapture Studio хотя и проста, но требует определенной интуиции и не менее увлекательна, чем какая-нибудь компьютерная игра. Уж не организовать ли чемпионат мира по этому пакету?