НовостиСобытияКонференцииФорумыIT@Work
Документооборот/ECM:

Блог

Бумага отступает, но не сдается!

Андрей Колесов
10.11.2011 15:23:51

Некоторое время назад мы беседовали с генеральным директором ABBYY Россия Григорием Липичем, в итоге чего образовалась такая статья-интервью с ним же. Ее название - “В России для задач capture — просто огромные перспективы” – довольно точно отражает основные тезисы статьи, которые я понимаю так:

Расход бумаги в офисах все же начал сокращаться, но объем capture растет. Две основные причины
1) растет доля "бумаги", вовлеченной в электронный документооборот
2) – очень любопытная шутка – технологии обработки "бумаги" используются и для электронных документов.

Наша беседа во многом стоилась на данных презентации "Overviewand Trends in the Capture Software Market 2010 –2015" Харви Спенсера (Harvey Spencer, помнится, он приезжал года три-четыре назад в Москву на DOCFLOW, я ему ассистировал при проведении круглого стола).

Вот несколько слайдов оттуда, которые помогут лучше понять разговор с Григорием Липичем.

Здесь все понятно. Интересно: в компаниях потребление бумаги снижается, а дома – нет. И то, что дома потребление быстро росло. Прямое следствие того, что "автоматизировали" производство – дома появились принтеры.



Объем бумаги в офисах уменьшается, а объемы сканирования растут. Растет использование изображений в транзакциях



Продажа ПО и железа опять растут



Вот это очень интересная статистика (компании Itella).
Финлядия – впереди Европы всей (кстати, один из главных производителей бумаги). В EDI и "аутсорсинге печати".
Но стоит также обратить внимание на Соединенное Королевство и Эстонию – там финансовые документы вполне можно пересылать по электронной почте, что они и делают




Комментариев: 41

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии

Дмитрий Шушкин
10.11.2011 19:41:44

Андрей, от себя хочу добавить, что длительное отсутствие внимания к теме обработки бумажных документов повлекло их существенное накопление в компаниях. Как в бумажном виде, так и в виде простых сканов без использования каких-либо элементов capture-процессов. Это, кстати, отчасти объясняет опережение в России роста рынка профессиональных сканеров по темпам над ростом рынка capture-продуктов.
В итоге сейчас мы имеем большие накопленные архивы бумажных изображений либо их просто скан-образов. При этом эти документы всё ещё актуальны для бизнеса и могут и должны быть использованы для различных процессов, начиная от элементарного излечения из них данных для BPM и заканчивая сложной многоуровневой аналитикой имеющихся архивов.
Всё это на мой взгляд даёт хороший задел для роста рынка capture-проектов в нашей стране.

Andrew
10.11.2011 22:32:31

Дмитрий, пытаюсь понять Вашу фразу "В итоге сейчас мы имеем большие накопленные архивы бумажных изображений либо их просто скан-образов.". "Бумажные изображения" - это оговорка или какое-то новое ноу-хау? smile:)

Дмитрий Шушкин
10.11.2011 22:42:36

Бумажных документов - разумеется. Это опечатка smile:)

Andrew
10.11.2011 22:26:07

Андрей, интересно, когда Вы беседовали о capture, Вы и Ваш собеседник одинаково понимали, что это такое? Если да, то почему бы не попытаться выразить это понятие на вроде как "великом и могучем" языке? Или в данном случае непонятная терминология по каким-то причинам удобнее? smile8) smile;)

11.11.2011 00:20:46

Я не могу вам сказать с гарантией в 100%, но, думаю, в целом все же одинаково понимали.
У нас много чего нельзя точно выразить на "великом и могучем".
У нас, например, не было слова для обозначения английского слова server. Потом придумали - сервер. Ну, и так далее...

Andrew
11.11.2011 01:12:26

То есть, Вы считаете, что это нечто существенно большее чем "оцифровка (и, если надо, распознавание)"? Если да, то в чём отличие?

Дмитрий Менщиков
11.11.2011 08:47:40

capture - это вроде бы больше чем просто сканирование. Это более сложный процесс, тут еще и индексирование (ввод сведений о сканированном документе) и верификация ввода. Но термин capture в русскоязычном тексте действительно режет по ушам и глазам.
Оцифровка документов - это хороший термин. Знакомые архивисты еще говорят просто "перевод в электронный вид". Слава богу, capture они еще не научились говорить.

К сожалению, с оцифровкой достаточно все непросто. У нас в архивах лежат много документов, рукописных, плохого качества и непонятных форматов (бывают склеенные финансовые ведомости длиной до 1,5 метра сброшюрованные в дела). Такое на обычном сканере не оцифруешь. Нужен сканер за миллион руб.
И это проблема.

11.11.2011 10:34:12

Дал комментарий по поводу Capture рядом в ветке

11.11.2011 10:33:35

Мне кажется, что статья начинается ровно с ответа на эти вопросы:

Цитата
задачи, описываемые английском термином capture, который на русский язык переводится как “захват” или просто “ввод” документов. Традиционно это направление связывалось с вопросами преобразования бумажных документов в электронный формат,
включая сканирование и распознавание текста.


Цитата
Точного аналога в российской документоведческой терминологии, кажется, просто нет. Можно сразу сказать, что операции сканирования и распознавания — это только часть комплекса задач capture. Возможно, даже слово “захват” тут больше подходит, чем “ввод”. Я бы определил capture как комплекс задач и технологий, связанных с преобразованием информационных объектов, существующих вне конкретной системы управления документами, в объекты этой системы. Простой пример — обработка бумажных документов, которые после сканирования, распознавания и регистрации становятся документами СЭД. Но это могут быть и задачи по “вводу” сообщений электронной почты, чтобы они и их атрибуты попали в ведение СЭД.

Дмитрий Менщиков
11.11.2011 10:55:55

Я предлагаю вместо capture применять термин "ввод документов в СЭД".
СЭД - это все-таки более-менее устоявшийся термин который стал почти как нарицательное имя.

11.11.2011 11:11:49

1. Кому вы это предлагаете?

2. Никак не могу согласится с таким "простым определением". Потому что СЭД - это совершенно расплывчатое понятие. Оно часто используется, но от того не становится понятнее.

Дмитрий Менщиков
11.11.2011 11:29:40

1. ИТ-сообществу.

2. Странно, а я как раз переживал, что мой вариант определения как раз более узкий, чем то, что понимается под "capture".
Полагаю, что capture - это некоторые действия над документами, для того чтобы их можно было обрабатывать в различных информационных системах.
Я предложил более узкое определение, включение документов в систему электронного документооборота. Но по сути оно о том же, зато использует всем понятные термины.

Я еще надеялся обсудить вопрос, что не все так просто с capture - много документов низкого качества (их и так сегодня с лупой рассматривают, а после сканирования будет еще хуже), бог знает каких форматов, а приемлемого по цене оборудования нет.

11.11.2011 11:55:16

1. Мне кажется, что тема Capture (как и многие другие) интересна. Конкретно предлагаю - напишите пост по вашему вопросу, опубликуйте и продолжим обсуждение.
Как нписать пост.
а) самому - для этого нужно зарегистрироваться на сайте. И у нас обязательное условие - сделать в профиле свое фото. Опубликовать
в) через меня (это хуже - зачем посредники). Пишите, я его публикую со ссылкой на вас.

2. По поводу СЭД. Тут есть принципиальный момент в понимании термина. Я по этому поводу писал еще год назад. СЭД - это система, работающая у заказчика" или инструмент, с помощью которого создается такая система. Ну, как ГЭС и турбины для ГЭС. Это разные вещи. В вашем определиени "каптуре" - это система, а у нас на рынке на 99% понимается - "инструмент".

Дмитрий Менщиков
11.11.2011 11:59:36

хорошо, я попробую

Andrew
11.11.2011 11:56:44

А в редакции "ввод документов в информационные системы"?

11.11.2011 11:58:41

Не могу понять, кому адресован вопрос и в чем суть вопроса.

Дмитрий Менщиков
11.11.2011 12:04:17

Это предлагается еще один вариант определения capture.
Но в нем смысл уже теряется. Ведь вводить в систему можно как угодно, в том числе и в виде форм ввода, или загрузки записей в базу данных.
А capture подразумевает, что электронный документ уже кем-то создан в виде e-mail, pdf, xsl, или его отсканировали с бумаги. И потом прицепили в систему. Вот это и есть capture.

Andrew
11.11.2011 12:12:00

Мне кажется, здесь не нужно переусердствовать. Само по себе английское слово capture не несёт столь многогранного значения - просто специалисты, понимают, что в конкретном контексте за ним стоит. Русские слова "оцифровка", "захват" IMHO ничуть не хуже.

А "каптуре" - ну это полное ... "каптуре" smile:)

11.11.2011 12:27:41

Мне лично, вариант "захват" кажется наиболее подходящим. И об этом статье говорится в самом начале. Другое дело, как раз этот термин используется у нас крайне редко.

"Оцифровка" - плохо, поскольку это только часть, причем, не очень обязательная часть "захвата"

Дмитрий Шушкин
11.11.2011 13:42:35

Видимо, слово "захват" ассоциируется у многих с террористами или вроде того. Поэтому его и не любят smile:)
Хотя технически оно действительно хорошо описывает процесс.

@Дмитрий Менщиков: Я не согласен с тем, что capture имеет место только тогда, когда "электронный документ уже кем-то создан". Вы сужаете задачу smile:)

Дмитрий Менщиков
11.11.2011 16:39:38

Я другой пример хочу привести:
Вы не замечали, как русскоговорящие иностранцы (израильтяне, европейцы) используют слово run для обозначения исполнения программы?
Они говорят "этот софт бежит под Линукс". С точки зрения прямого перевода так может быть. Но мы же в России так не говорим!

Я к тому, что нет прямого соответствия английским и русским словам. И оттенки значений многозначного слова capture (на английском) позволяют его использовать там для обозначения этого процесса. А это слово использовалось для обозначения именно процесса сканирования - посмотрел Longman. А уже потом расширили до того, как сейчас понимается этот процесс.
Но в русском мы никогда не говорили "захватил документ на сканере". И поэтому слово "захват" ничего не несет за собой, если его использовать для того, что понимают "у них" под capture

Ну а "каптуре" - это "каптуре", тут я согласен с комментарием выше...

11.11.2011 12:13:04

Признаться, я запуталься в ветках обсуждений и не понимаю, какой комментарий к чем относится.

Конечно, это вопрос договоренностей - как понимать тот или иной термин. Но чтобы договариваться нужно понимать - зачем и с кем. А как фирсировать договоренности. А иначе - это будет просто сотрясание воздуха.

Andrew
11.11.2011 12:28:43

В общем-то, уже существуют документы, хорошо ли, плохо ли, но "фиксирующие договоренности" по переводу термина capture - это ГОСТ Р ИСО 15489 и русские переводы спецификаций MoReq - там этот термин встречается. Сейчас ВНИИДАД готовит перевод стандарта ISO 30300, там по тексту этот термин тоже придется переводить.

11.11.2011 12:48:12

"уже существуют документы" - это примерно как "мы пахали".
Пахали - а каков результат? Существуют, то толка от наличия...
Проблемы-то остается. И то, что у нас нет терминологической базы и есть проблемы от ее отсутствия, - говорится постоянно, не только мной.

Либо документы не очень хороши, либо существуют как-то не так...

Andrew
11.11.2011 12:57:52

Либо документы не очень хороши, либо существуют как-то не так...

А Вы их сначала прочитайте. возможно, они от этого станут лучше smile;)

11.11.2011 13:02:02

А почему вы написал "Вы" (с большой буквы):?
Это нужно советовать не мне, всему "сообществу". Оно жалуется на проблемы с терминологией. Меня лично эта проблема не очень трогает.

Дмитрий Шушкин
11.11.2011 13:38:10

Дело в том, что ввод документов и данных(!) бывает не только в СЭД smile:)
СЭД - это лишь одна из систем-"потребителей" информации, полученной в рамках её извлечения из бумажных документов или их изображений. А само извлечение тоже очень много из чего состоит, включая обработку изображений, например.
Поэтому задача выбора подходящего термина в русском языке, согласен с Андреем, к сожалению, очень непростая.

11.11.2011 13:51:40

Мне как раз вопрос "выбора термина" кажется не сложной задаче. Сложнее - толкование, тут одной поясняющей фразой не обойтись.

Кстати, в выборе термина очень важна роль разработчика, ведущего. В данном случае - ABBYY, как лидера.
Вы-то сами - какой термин используете? У меня такое впечатление, что вы и сами не решили для себя.

А как вы будете говорить (говорить постоянно), так, скорее всего, будут говорить и все остальные. Тут ваша роль является решающей, а не ВНИИДАДа...

Примеров в ИТ - полно.
Я вопросами "локализации" занимался плотно еще в 1994 году. Так вот: как начала говорить MS, так и все стали за ней...
Тут как раз тот случай, когда даже не оптимальное решение будет лучгше, чем отсутствие такового.
Но я знаю процесс и знаю, что MS - при всех недостатках - очень серьезно занималась этим дело.

Так что - решение вопроса с capture - это задача для ABBYY. Не нужно ждатьВНИИДАДа. Это они ждут вас smile:)

Дмитрий Шушкин
11.11.2011 14:01:03

Нашу позицию Григорий озвучил в рамках интервью.

Дмитрий Шушкин
11.11.2011 14:01:32

Нашу позицию Григорий озвучил в рамках интервью.

11.11.2011 14:10:54

По какому вопросу? Как переводить термин или как его "продвигать"?

Позиция по переводу из текста видна - использовать английское написание, Capture.
Для Госов это точно не подойдет.
Как продвигать? этот вопрос в интервью не обсуждался вовсе.

Andrew
11.11.2011 14:04:40

Кстати, в выборе термина очень важна роль разработчика, ведущего.

С этим я согласен. Но есть "парная" закономерность: отсутствие в терминологии компании русского термина говорит о том, что лидером российского рынка в соответствующей области она ещё не стала (иначе бы уже нашла такой термин, чтобы доходчивее рекламировать свою продукцию) smile;)

11.11.2011 14:21:43

И я, в свою очередь, согласен smile:)

11.11.2011 14:57:19

В общении с госами мы используем те русскоязычные термины, которые лучше подходят для решения конкретного процесса, который обсуждается. При этом, что в госах, что в коммерческом секторе уровень абстракции в нашем общении с ними становятся более низким, чем ближе к обсуждению конкретного информационного процесса обстоит дело.

Но одного слова, которое бы так же легко ложилось на ухо как как в западном мире ложится сейчас capture пока действительно нет. Иногда мы говорим о вводе бумажных документов, иногда о распознавании документов, иногда говорим о обработке документов и извлечении данных из них. И отсутствие одного слова не мешает расширять бизнес smile:D

Вполне допускаю, что внедрив дескриптивный и емкий термин из одного-двух слов мы сможем чуть легче информировать потенциальную аудиторию потребителей. Но такие термины обычно рождает жизнь. Пока же мы (имею ввиду ABBYY), со всем своим лингвистическим опытом, не смогли подобрать хорошего слова, несмотря на то, что собаку съели в вопросах распознавания документов, извлечения и обработки информации из них.

Если придумаем сами или общественность подскажет что-то хорошее, то обязательно введем в оборот и активно будем его использовать, чтобы он стал общепринятым

Если у кого-то есть вопросы / комментарии по сути моего интервью Андрею, то готов ответить как тут так и в почте gri at abbyy dot com

11.11.2011 15:35:55

Кстати, подумав немного, я пришел к выводу, что вариант "кепче" -- уже лучше всего вошел в наш обиход. В очередной раз недавно столкнулся с подобной терминологической проблемой в облачной сфере и, как лидер в этой темеsmile:) решил этот вопрос - http://www.pcweek.ru/its/blog/its/1865.php

Дмитрий Менщиков
11.11.2011 16:20:22

Даже если и вошел, то только как жаргон, а не технический термин, который можно применять в технической документации.

11.11.2011 16:30:08

Вы знаете, я не филолог, но все же по роду деятельности уже почти 20 лет непосредственно связан с проблемами формирования нашего ИТ-языка, вижу как это происходит.

1. Есть нет термина, значит, нет и необходимости в нем. Нет самого понятия.
Отсутствие термина кетче четко отражается отсутствие сколь-нибудь сформировавшейся предметной области в России.

2. Профессональный жаргон - это нормальный путь формирования профессионального языка.

Мне например, надоело каждый раз использовать для обозначения on-premise soft - перевод "традиционное ПО", и я начал писать (не говорить, а писать) - онпремис-ПО. И не в документации, которую читают 10 человек, а в публикациях с тысячной (и более) аудиторией. И, в целом, - приняли.
Главное в терминологии -- ее однозначное понимание всеми. А утверждение в ГОСТ - это уже дело десятое.

Дмитрий Менщиков
11.11.2011 16:48:11

Давайте уже поскорее начнем говорить -
фри софтвер (или даже лучше - софтвер-фри), оупен-сорс-софтвер, и так далее...

11.11.2011 17:46:54

Мы уходим в сторону о темы. Но в вашем варианте ничего особенного не вижу.
И кстати, как многие другие люблю картошку-фри smile:)
Гораздо важнее, чтобы, когда я заказываю картофель-фри, мне принесли именно то, что я прошу.

14.11.2011 12:04:42

Обычно англоязычные заимствования как-то лучше подходят для имен существительных означающих какие-то статичные вещи, объекты, а capture - это процесс и тогда скорее не кепче, а кепчирование smile:D Но что одно, что другое, как по мне, не для нашей жизни.

Ну а в целом рынок есть и лидер тоже есть smile:) Однако размер рынка не сравнится с рынком операционных систем или офисных приложений, потому, мне кажется, и задача придумывания терминов не настолько актуальная как в случае Microsoft с Windows или Office. Рынок capture в России сейчас пока исчисляется лишь в десятках миллионов долларов, однако и этого хватает для того, чтобы с ним работать активно. И больших игрокам и игрокам помельче места на этом рынке хватит, если конечно у игрока есть продукты и технологии, которые этим рынком востребованы.

Andrew
11.11.2011 19:36:20

Григорий Липич писал: Пока же мы (имею ввиду ABBYY), со всем своим лингвистическим опытом, не смогли подобрать хорошего слова, несмотря на то, что собаку съели в вопросах распознавания документов, извлечения и обработки информации из них.

Может быть, это происходит потому, что "собаку едят" одни, а маркетингом занимаются другие люди, возможно, слегка подзабывшие в зарубежных поездках родной язык?

Характерно, что на последних DOCFLOW половина зала не понимала, о чем им рассказывал Манчини - именно из-за "удачного" перевода ключевых терминов.

Впрочем, возможно, всё это и к лучшему - пренебрежительное отношение крупных игроков к своим клиентам (проявляющее, в частности, в бравировании своим знанием пары английских словечек) дает дополнительные шансы игрокам помельче, готовым общаться с клиентами но понятном тем языке smile:)

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии