НовостиСобытияКонференцииФорумыIT@Work
Документооборот/ECM:

Блог

Форматы документов и долгосрочное хранение документов

Андрей Колесов
16.02.2011 11:09:04

Вчера увидел публикацию Станислава Макарова "Как новый ГОСТ изменит рынок СЭД"

Советую почитать, там говорить о проблемах форматов офисных файлов и долгосрочного хранения электронных документов. Тема, которая у нас в СЭД-сообществе фактически даже не обсуждается. Утоню: упоминается, но не о обсуждается в плане ее решения и продвижения вперед.

Если бы в названии статьи было бы в конце знак "?", то я бы ответил на поставленный вопрос – никак не изменит (мне показалось из статьи, что Станислав отвечает на него в целом положительно).

Тема большая, очень много аспектов.

Я знаю, что некоторые (или многие?) читатели считают вопрос "что такое электронные документы" – мой навязчивой идей, но я лично постоянно упираюсь именно в него, когда начинаем рассматривать чисто практические вопросы.

Например. В статье Станислава фактически говорится лишь об офисных "текстовых" документах (то чем занимаются текстовые – как их по традиции называют – редакторы). А что делать с электронными таблицами, презентациями, мультимедийными файлами?

И, наконец, кто-нибудь ответит: сообщения электронной почты – это документы или что? Что там у них с форматами?

И вообще, все эти разговоры про курс "Партии и Правительства" на поддержку Open Source выглядят довольно странно, учитывая, что постановления правительства на этот счет публикуется в формате DOC.
Кстати, кроме ODF есть еще такой открытый формат как HTML. Да и Open XML.

Но – есть проблемы электронного взаимодействия оперативного плана и есть вопросы долгосрочного хранения документов.

Возможно ошибаюсь, но проблема хранения электронных документов у нас в отрасли вообще не рассматривается. С одной стороны, постоянно упоминаются какие "электронные архивы документов", но когда начинаешь "копать", то выясняется это совсем не архивы электронных документов.

И опять же: как можно делать архив неизвестно чего (электронных документов)?

А результатом этой неразберихи является появление странных заявлений (причем как очевидных фактов), что одно из преимуществ бумажных документов (перед электронными) – это обеспечение их долгосрочного хранения.

При этом принципиальным моментом является то, что с одной стороны сравнения есть очень четкой определенный объект, а с другой – непонятно что.

Комментариев: 8

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии

Михаил Романов
16.02.2011 12:48:42

Как обычно, не претендуя на всезнание...
Из моего личного опыта:
1. Технологии (к коим я отношу форматы документов) не самая первостепенная проблема - на много важнее считается привести в порядок процессы работы с документами.
2. Это известный факт: задача долговременного хранения электронных документов - мало кого из заказчиков сегодня интересует, основные задачи - оперативное управление документами на сроках 2-3 года. Есть, конечно и исключения, но они редки и там все решается "на месте".
3. То, что в основном говорят о текстовых документах (т.е. которые содержат текст и уже не важно скан это или документ в офисном формате) тоже закономерно - они представляют основную ценность для компании. И они используются повсеместно.
А все остальные материалы это или удел специализированных систем (например, чертежи - PDM), или специальные, пока еще довольно редкие случаи интереса (например, фотоархивы для страховых случаев) - делаемые индивидуально.

Что касается статьи, то она если и не заказная, то несколько непрофессиональна.
Автор задает правильный вопрос "Важны ли форматы для СЭД", но отвечает на него максимально расплывчато и вообще-то не верно.
Да, есть задачи, в которых нужны не только механизмы библиотечного хранения (когда содержимое документа рассматривается как "черный ящик"), но это частные случаи, которые решаются по-разному, чаще всего средствами самого офисного пакета (или другого готового ПО) и интеграции с ним.
Рассчитывать, что публикация тысячистраничной технической спецификации на формат сподвигнет производителей СЭД начать с ним работать не стоит - оно не окупится, проще синтегрироваться с одним из офисных пакетов (благо в корпоративе используется их только 2 - либо от Microsoft, либо от Oracle).

16.02.2011 13:20:29

Цитата
Что касается статьи, то она если и не заказная, то несколько непрофессиональна.

Аргумент "заказная" - это обычно, когда нечего сказать по существу. В этом комментарии как раз говорится по существу, поэтому намек на "заказ" тут просто лишний.

Цитата
Рассчитывать, что публикация тысячистраничной технической спецификации на формат сподвигнет производителей СЭД начать с ним работать не стоит - оно не окупится, проще синтегрироваться с одним из офисных пакетов (благо в корпоративе используется их только 2 - либо от Microsoft, либо от Oracle).

Я тоже на этот момент обратил внимание и хотел сказать отдельно.
Действительно, если бы спецификации "Лексикона" были бы открытыми, то разве кто-то взялся сегодня разрабатывать оп ним "читалку"?
Это, конечно, вариант решения проблемы обеспечения совместимости, но явно не оптимальный. Что-то вроде разгадывания содержания архиологических находок.

Все же в промышленных масштабах проблема должна решаться как-то иначе.

Кстати, не помню как последние форматы Лексикона, но тех, что были в ДОСе, они были достаточно простыми - что-то вроде HTML, только намного проще.

16.02.2011 12:50:07

Знаете, Андрей, если бы Вы забыли свои «комплексы», и не пытались через строчку язвить по поводу не понимающих Вас коллег по отрасли, то, возможно, получился бы хороший проблемный пост.

То, что что-либо не обсуждается / не посещается / не читается / не воспринимается Вами, ещё не означает, что эти вопросы вообще не обсуждаются в отрасли. Так, тема открытых форматов год-два назад была предметом настоящих баталий (как в печати, так и на конференциях), а о проблеме долговременного хранения кое-кто (не буду показывать пальцем) пишет регулярно, рассматривая, в том числе, и проблему форматов.


Теперь по существу вопроса. Я тоже считаю, что, с технической точки зрения, перевод стандарта ИСО на формат ODF особого значения для ИТ-отрасли не имеет. Данная конкретная версия ODF на сегодняшний день поддерживается, если не ошибаюсь, только продуктами компании Майкрософт, в то время как остальные разработчики используют более совершенную версию формата, не прошедшую пока что стандартизацию в ИСО. Да и разработчикам надёжнее пользоваться первоисточником на английском языке, чем переводом, в котором, несомненно, найдутся ошибки.

Принятие ГОСТа – несомненная моральная победа сторонников ODF и СПО, которая, однако, может, при случае, обернуться для них крупными неприятностями, если, скажем, государственные органы потребуют точного соответствия программных продуктов этому стандарту.

Тезис Станислава Макарова о том, что «наличие стандарта будет способствовать распространению свободного ПО, особенно в госсекторе» мне кажется неубедительным, тем более, что, - как отмечает он сам, - проприетарные продукты также поддерживают формат ODF.

IMHO серьёзной ошибкой, часто встречающейся в ИТ-литературе, является то, что ODF рассматривается как формат для длительного (архивного) хранения электронных документов. На самом деле практически все архивные службы, - даже тех стран, которые давно ориентируются на открытые форматы и открытое ПО, - рассматривают ODF как хороший офисный формат, удобный для организации коллективной работы над документами, для обеспечения интероперабельности, однако неподходящий для архивного хранения документов. Для архивного хранения рекомендуются другие форматы, с куда большей надёжностью обеспечивающие сохранение документов в неизменном виде, и в первую очередь PDF/A.

Отдельной темой для обсуждения является вопрос о том, что понимать под «открытыми форматами». Есть американская трактовка (достаточно, чтобы полные спецификации формата имелись в свободном доступе), есть европейская (формат должен быть полностью подконтролен авторитетной некоммерческой организации типа ИСО), а вот российские государственные органы своей позиции пока ещё не обозначили.

16.02.2011 13:11:59

Цитата
Знаете, Андрей, если бы Вы забыли свои «комплексы», и не пытались через строчку язвить по поводу не понимающих Вас коллег по отрасли.


Хочу отметить, что вы пишите комментарий в моем посте (не "блоге", а именно "посте"). Т.е. это "моя территория". Я имею полное право удалить ваш комментарий, но буду этого делать.
Могу только напомнить общее правило Форумов (оно, в общем-то, распространяются и на блоги) - тут обсуждают вопросы по существу, а не личные качества авторов.

Прошу это помнить и выполнять.

16.02.2011 13:48:47

Цитата
Так, тема открытых форматов год-два назад была предметом настоящих баталий (как в печати, так и на конференциях),

Я в курсе этих "баталий". Это были баталии из разряда "шумим, брат, шумим" (С, "Горе от ума"). Не понятно, какую проблему обсуждали и что же порелшили в результате.

Дискуссии были откровенно инициированы западными ИТ-поставщиками в рамках их мировых дел. PR-деньги закончились и участники битвы в обнимку разошлось по домам.

16.02.2011 13:53:46

Цитата
Колесов: Советую почитать, там говорить о проблемах форматов офисных файлов и долгосрочного хранения электронных документов. Тема, которая у нас в СЭД-сообществе фактически даже не обсуждается. Утоню: упоминается, но не о обсуждается в плане ее решения и продвижения вперед.

Ну почему же не обсуждается? Например, этому была посвящена презентация на DOCFLOW 2008 : "Открытые форматы и открытое ПО: достоинства и проблемы", см. http://www.eos.ru/upload/AllPresentations/OpenPOFormats2.ppt

Цитата
Колесов: Возможно ошибаюсь, но проблема хранения электронных документов у нас в отрасли вообще не рассматривается.

Ошибаетесь, рассматривается. Например в этой статье "Как хранить электронные документы? Советы эксперта" http://www.cnews.ru/reviews/index.shtml?2008/04/10/296523

16.02.2011 14:04:22

Цитата
Колесов: И, наконец, кто-нибудь ответит: сообщения электронной почты – это документы или что?

Рекомендую посмотреть следующие материалы:


16.02.2011 19:05:45

Подборка ссылок хорошая. Уверен она будет интересна читателям.
Но почему-то вспомнил афоризм: "если больному предлается много вариантов лечения, то, значит, он безнадежен smile:-)

То, что емейл является доказательством в суде - это давно известно. Но входит ли реально почта в состав ведения ДОУ-подразделения организаций?
Посмотрите на результаты нашего онлайнового опроса: http://www.pcweek.ru/ecm/blog/ecm/697.php
Оттуда можно сделать вывод, что почта часто не рассматривается в качестве механизма официального взаимодействия, ни внутри, ни наружу.

Хорошо, почта - это документы.

А как обстоят дела с ее хранением?

Собственно пост был о том, что форматы текстовых файлов -- это далеко не весь круг задач долгосрочного хранения документов.

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии