НовостиСобытияКонференцииФорумыIT@Work
Документооборот/ECM:

Блог

Еще более электронный документ

Сергей Бушмелев
22.05.2012 15:42:23

Недавно столкнулся с одной задачей. Есть набор фактов, каждый факт - это текстовое выражение, от одного до 10 предложений. Есть еще картинки и таблицы. Факты свалены в кучу в виде плоского текста с вкраплениями картинок и таблиц. Чтобы эффективно работать с фактами, необходимо все их пометить тегами, причем тегов у каждого факта может быть несколько. Далее, по запросу (выбору одного или нескольких тегов) нужно будет вывести список соответствующих фактов. Попытался найти офисное средство автоматизации, которое бы помогло решить задачу. Поскольку львиная доля информации представлена в текстовом человекочитаемом виде, то, по идее, должен подойти текстовый процессор, например, MS Word. Но он в моих руках решает только треть задачи - хранение массива фактов, и не очень понятно, как сделать интерактив.

Электронные таблицы с их динамическими фильтрами также априори не совсем подходят для решения задачи, ибо, как я уже говорил, тегов у каждого факта может быть несколько. Воображение услужливо рисует OLAP-куб - действительно, его возможность "выворачивать" данные нужным образом очень бы пригодилась, но у меня текстовые, а не числовые данные, да и нет регулярности, присущей OLAP-кубу. Не сомневаюсь, MS Access запросто выручил бы, но задача разовая, и тратить время на создание таблиц, форм для ввода-вывода, отчетов, запросов не хочется.

И вот, вместо поиска решения для задачи в настоящем, я стал мечтать об электронных документах будущего. Еще более электронных, чем сейчас. Которые будут объединять данные, метаданные, интерфейс, средства пользовательской автоматизации, средства интеграции с другими бизнес-системами. Сам функционал документа позволит работать с его данными, преобразовывать их, выводить в разном представлении. В зависимости от системы, обрабатывающей документ, будут доступны различные дополнительные функции. Или, вообще, вне зависимости от информационной системы и среды, будет доступен функционал. Документ объединит удобство ввода текстовых данных, предоставляемое текстовым процессором с интерактивностью электронных таблиц, возможность проведения презентаций с поддержкой сложной организации данных и возможностями разработки, как базы данных MS Access. Возможно, в чем-то моя идея перекликается с идеей Максима Галимова - универсальный документ для произвольных задач. А почему бы и нет?

А вы как думаете? Каким вы видите будущее электронных документов? Изменится ли их функционал? Будут ли новые сценарии использования?

Комментариев: 12

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии

Михаил Адигеев
23.05.2012 11:22:00

Цитата
Чтобы эффективно работать с фактами, необходимо все их пометить тегами, причем тегов у каждого факта может быть несколько. Далее, по запросу (выбору одного или нескольких тегов) нужно будет вывести список соответствующих фактов. Попытался найти офисное средство автоматизации, которое бы помогло решить задачу.


Это (может, не очень удобно и интуитивно) есть в MS OneNote.
Если факты просто свалены в кучу (а не размещены на странице в каком-то определённом порядке), то и в Evernote есть. Наверное, в других "заметочных" приложениях тоже.

Максим Смирнов
26.05.2012 09:52:09

Офисные приложения, действительно, мало подходят для работы с фактами и знаниями. Возьмите любое современное приложение, появившееся уже в эру мобильных устройств, какой-нибудь Evernote и т.п., теги и категории в них встроены изначально. Вместе с понятием Enterprise 2.0 в лексиконе айтишников появилось слово freeform, означающие, что сначала в информационной системе появляется объект, а потом у объекта формируется структура. Реляционные базы данных приучили нас думать иначе: сначала программист создает структуру, а потом мы засовываем в неё объекты. При этоv, очевидно, что мы не всегда с первого раза можем правильно классифицировать объект.

Вообще, тема достаточно проработанная. Semantic Web, Linked Data, NoSQL - это все об этом. Пару лет назад я делал презентацию в Клубе архитекторов Майкрософт Архитектура предприятия в формате Semantic Web, в которой рассказывал как использовать Semantic Mediawiki для учета информационных систем организации. С этими информационными системами - настоящая беда. У одних база данных Oracle, у других MS SQL, у третьих - нет базы данных, четвертые написаны на java, а другие и на java и на .NET А еще они синтегрированы друг с другом, поставляются, развиваются и поддерживаются разными компаниями, используются разными подразделениями и т.д. и т.п.

26.05.2012 10:16:11

Я бы не стал спешить с тезисом о том, что традиционные документы-файлы и офисные приложения не подходят. У объектно-ориентированного подхода много своих минусов. В том числе - традиции человеческого мышления. Я пытался в свое время использовать в работе того же OneNote - не получилось. Прикольно, но получается трудоемко и малоуправляемо. Другое дело, что возможно, чтобы внедрить тот же OneNote нужно начать работу с ним еще в детском саде. Нужно другое мышление.
А может быть, это в принципе не возможно. Ведь объектные СУБД - дело давнее, но пока они не прижились.
Может быть, тут как с СПО - да, вещь полезная, но вот вам 5-10% доли специфического рынка и никуда дальше.

Максим Смирнов
26.05.2012 10:40:19

Андрей, с вашего разрешения, отмечу несколько нюансов:
1. Я не про объектно-ориентированный подход. Идея freeforn - это принципиальное отрицание такого подхода. Это о другом. Скорее речь о "Design by doing vs. Doing by design" и концепция ECM построена именно на примате данных перед структурами данных. (Далее должна последовать длинная дискуссия о том, что же такое Enterprise 2.0 на самом деле, а не глазами пользователей)
2. Традиции человеческого мышления, или как модно теперь говорить user experience - это самое важное. Именно это и меняют соц.сети и мобильные устройства. Люди, сидевшие 20 лет за экранными формами корпоративных бизнес-приложений, вдруг, научились думать и действовать иначе (еще учатся)
3. NoSQL это не LotusNotes и не DBVista, придуманные в прошлом веке. В ИТ отрасли случилась технологическая революция. То что считалось незыблемым в течении последних 25 лет в части хранилищ данных сейчас меняется, прямо на наших глазах. BigData - это просто один из отголосков такого изменения. Верить в это или не верить - это вопрос, который каждый решает сам. Лично я года 3 не верил, пока сам не увидел, что высоконагруженный интернет и телеком технологически кардинально изменились.

26.05.2012 11:03:44

Цитата
Андрей, с вашего разрешения,

Разрешаю. Более того - прошу!!! smile:)
Я совершенно убежден, что нам нужно все это и обсуждать. И самое главное - как-то реализоваывать.

Причем нужны не только разговоры и публикации, нужно пытаться выходить на какие-то конкретные дела и результаты. Я например, уверен, что было бы интересно пообщаться очно на той же DOCFLOW, Но там - не получается. Значит, нужно создавать площадки самим.

johnker
29.05.2012 10:32:52

Отличный пост, спасибо. Одна из самых актуальных тем показана на конкретном примере. Фактически речь идет о способе визуального структурирования изначально неструктурированного текста. Расстановка тегов пользователем в произвольном тексте это один из таких способов структуризации.

На самом деле это глобальный тренд. Я уже писал на эту тему в своем блоге в постах "Дейта-теги в PayDox Case Management связали поручения сотрудникам с корпоративными справочниками", "Сцилла и Харибда структурированного и неструктурированного контента в функционале информационных систем и HTML Microdata как ключ к тесной интеграции"

29.05.2012 15:24:18

Хорошая получается дискуссия. Ваши комментарии натолкнули меня еще на одну мысль:
Традиционно единицей информации в ECM-системе считается документ. Управление документами ведется на уровне метаданных. Документ может оставаться в системе черным ящиком, и только некоторые операции обращаются к его содержимому. Например, полнотекстовый поиск.
В России многие СЭД (ECM) ведут свое родство от систем автоматизации традиционного делопроизводства, это отчасти объясняет их документоориентированность. Другая причина того, что единицей информации считается документ, является то, что обработкой контента занимаются приложения, СЭД осознанно (концептуально) не содержит средств серьезной обработки контента, СЭД - это инраструктурное ПО, занимающееся хранением, оборотом документов, вовлекает их в бизнес-процессы компании.
Максим Смирнов натолкнул меня на мысль, что единицей информации в ECM (Document Management, Knowledge Management, Information Management) может стать и факт, и идея, и мысль и какая-то единица данных. Можно сказать, что в системе не будет понятия "документ", так как система будет оперировать меньшими, чем документ, агрегациями. Или же, вся система является одним, постоянно изменяющимся сложным электронным документом. Задачей такой системы будет как-раз построение связей между этими единицами информации, способность "вытянуть" весьобъем знаний по заданному вопросу.

Я переопубликовал этот пост на ecm-journal. Рекомендую почитать комментарии Вячеслава Смирнова, очень интересные, на мой взгляд.

10.06.2012 11:46:45

Сергей писал
"Можно сказать, что в системе не будет понятия "документ", так как система будет оперировать меньшими, чем документ, агрегациями. Или же, вся система является одним, постоянно изменяющимся сложным электронным документом. Задачей такой системы будет как-раз построение связей между этими единицами информации, способность "вытянуть" весьобъем знаний по заданному вопросу. "

Браво! Остался один шаг до перехода представлений от документо-центрической системы к системе, где в центре находится деятельность, а вокруг неё крутятся документы.

10.06.2012 12:36:17

Отлично сформулировано!
Как раз в этом и отличается наша идеология СЭД от западной идеологии ECM (назовем ее так). Я именно к такому пониманию пришел еще несколько лет назад в дискуссиях с нашими СЭД-поставщиками.

У нас документа рассматривается как некая самоцель, а человек - лишь принадлежность к нем. Человек для документа, а не документ для людей.
И мы делаем так, как удобно документу, а не человеку.
Мы решаем задачи хранения, не сформулировав - зачем нужно хранить. Именно поэтому мы сталкиваем для непреодолимой для нас задаче, например, долгосрочного хранения документов. Потому что, мы храним документ ради документа....

Да, вы сказали принципиально важное замечание! Спасибо!

10.06.2012 13:40:54

Андрей, спасибо за спасибо!
Не ожидал именно от вас такой эмоциональной реакции.
Основная проблема документоцентрического подхода - параллельная разработка документов даже в одном контексте. Слово параллельная понимается в буквально: смыслы документов не пересекаются, и при этом они разнонаправленны.
Если за основу взять деятельность, тогда документы будут производными, на них можно будет вообще не обращать внимания, они будут просто выписками (как это было замечено вами про паспорт в параллельном блоге).

10.06.2012 13:51:15

Почему не ожидали? Как раз эмоциональность, порой излишняя, кажется, характерна для меня (об этом мне часто говорят, причем совсем не только в плане позитива).

Иначе, я бы не занимался блогами и социальными сетями. Кстати, приглашаю вас присоедиться к этому сообществу на Фейсбуке. http://www.facebook.com/#!/groups/ecm.group.rus/

И будем вместе двигаться "за горизонты СЭД" smile:)

P.S. Там недавно был затронут такой вопрос: чем СЭД отличается анти-СЭД (такой спорный термин, но все же).
СЭД нацелена на автоматизацию сложившейся системы документооборота.
Анти-СЭД (за горизонты) - на повышение эффективности деятельности организации

Разница в целях и задачах по-моему очевидна.

Александр
10.07.2012 14:50:40

Сергей, нужно не мечтать, а внимательно изучать современные технологии управления контентом.
Возьмите XDB Oracle в 1998 вышла 8 версия, где уже внедрялась объектно-реляционная модель (ОРМ). 9 версия уже включила в свое ядро OIPM и основной функционал XML-base. Все пришла эра сквозного управления контентом. Мапируй типы XML данных на типы БД и манипулируй контентом средствами SQL.
XML-table помогут в этом легко и просто. И накаких фантазий - голая реальность версии 11.3 Oracle.
Незачем, Сергей фантазировать о манипулировании строковым контентом. А вот о метаметаконтенте пофантазировать можно, если Вы его понимаете...

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии