НовостиСобытияКонференцииФорумыIT@Work
Open Source:

Блог

О форматах файлов для "ГосСЭД"

Сергей Голубев
24.11.2011 12:08:16

Вчера я уже писал о приказе Минкомсвязи РФ от 02.09.2011 N 221 "Об утверждении Требований к информационным системам электронного документооборота федеральных органов исполнительной власти, учитывающих в том числе необходимость обработки посредством данных систем служебной информации ограниченного распространения".

Хочу продолжить, только уже не в-общем, а в-частности.

Речь пойдет об одной строке этого приказа. Вот она:

Цитата
СЭД ФОИВ должна обеспечивать отображение следующих форматов файлов: pdf, rtf, doc, tiff.


У меня что-то с глазами или в перечень действительно не попал odt? Тот самый odt, который соотвествует ГОСТ Р ИСО/МЭК 26300-2010 "Информационная технология. Формат Open Document для офисных приложений (OpenDocument) v1.0".

Попробую понять логику авторов документа. Допустим, они большие поклонники Оккама и решили не плодить лишних сущностей. Но в этом случае следовало бы указать только один формат. Не важно какой, но один.

Если же ориентироваться на разнообразие, то следует руководствоваться народной мудростью - где четыре, там и пять. Или шесть.

А поучилось странное - не рыба и не мясо. Я не поклонник теории заговоров, но другого объяснения предложить не могу - odt не включили по каким-то необъяснимым с позиций формальной логики причинам. Хотелось бы их узнать.

Комментариев: 37

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии

24.11.2011 14:05:13

А у кого узнать?

Я как раз утром написал по этому поводу пост: http://www.pcweek.ru/ecm/blog/ecm/2029.php

Причем, вопрос - "у кого узнать" - относится практически к любому проекту с участнием государства, в том числе НПП, НОП и пр...

24.11.2011 14:12:58

Твой пост читал. Согласен с тем, что действия госчиновников приводят прежде всего к тому, что государство все больше выключается из реальной жизни. Это тянет на масштабную диверсию smile:).

24.11.2011 14:20:11

Никакая это не диверсия, а обычная (как задумано) схема работы нашей системы госуправления, которую многие называют "государством", наделяя при этом ее чуть ли не божественными свойства вселенского разума. И это - не смешно smile:(

24.11.2011 14:34:06

Мне кажется, все сложнее. По-моему, последние 20-25 лет мы живем по принципу "пусть нам будет хуже". Как будто все хотят доказать всем, что тогда что-то было сделано неправильно и вот что из этого получается.

24.11.2011 14:44:58

Я так не живу. И подавляющее большинство страны - тоже.

24.11.2011 15:37:23

Мы с тобой - да. Но это потому, что у нас работа хорошая - от нас ни вреда, ни пользы smile:))).
А вот насчет большинства не уверен. Мы массово пишем на стенах лифтов, не пропускаем пешеходов на зебре, паркуемся так, что мамы с колясками пройти не могут, пускаем своих собачек гадить на газоны... Мы стали очень злыми.

24.11.2011 16:33:31

Цитата
У меня что-то с глазами или в перечень действительно не попал odt? Тот самый odt, который соотвествует ГОСТ Р ИСО/МЭК 26300-2010

То, что на некоторый формат есть ГОСТ не означает его автоматического применения где ни попадя.

Цитата
А поучилось странное - не рыба и не мясо.

А вот и нет. Получился вполне нормальный набор форматов, каждый со своим непересекающимся назначением:
- Doc - формат для хранения редактируемого контента, например, проектов документов.
- tiff (многостраничный) - один из самых распространенных форматов для хранения отсканированных образов
- pdf - формат для хранения кончных документов, документации, ... - в общем, документов, не требующих изменения.
Единственный "отщепенец" - rtf. Думаю, его роль - "для совместимости", т.к. как минимум до версии 1.7 этот формат худо-бедно, но поддерживался очень многими редакторами, а также различными средствами автоматического формирования документов (генераторы отчетов).

А odt - это формат, повторяющий функционал doc или rtf. Его включение в требование об отображении имеет смысл если только ПО, которое продуцирует этот формат очень расспространено.
Похоже это не так.

Правда все перечисленные форматы - это форматы представления произвольного текста.
Здесь не представлены форматы для электронных таблиц, медиа данных, каких-то специальных форматов.
Почему - вопрос. Могли просто забыть, могли планировать все конвертировать в тот же PDF, могли проанализировать и выяснить, что процент использования других форматов весьма ограничен и если где-то есть в них потребность, не проблема решить вопрос на месте.

Как видите, Сергей, объяснения могут быть вполне нормальными и без всяких заговоров.

Евгений
24.11.2011 16:47:17

Хреновое объяснение. Хотя бы потому, что формата doc не существует в природе и только наши чиновники "от сохи" умудряются путать расширение файла (*.doc) с форматами представления данных. Сама компания Microsoft уже несколько лет назад занялась стандартизацией того, что ранее было непонятно чем, остановилась на xml, сотворив его очередную реинкарнацию в виде OOXML, которому кстати как стандарту файлы с расширением docx не соответствуют, хотя обещания реализовать в соответствии с форматом OOXML компанией давались в процессе стандартизации.
Кроме того, государство, объявляющее о поддержке нескольких технологических платформ, должно заботиться о своей независимости от конкретных вендоров. Использование открытых стандартизированных форматов, к которым как раз и относится ODF, должно гарантировать, что в случае исчезнования OpenOffice, LibreOffice, Microsoft Office и проч. всегда можно при необходимости создать что-то свое. Ан нет. История с лексиконом и кучами файлов после него не вошла в мозги.

24.11.2011 17:10:01

Цитата
Хреновое объяснение.

Приведите лучше, коллега.

Цитата
путать расширение файла (*.doc) с форматами представления данных.

Могу вас огорчить, ".doc file format" это официальное название, которое использует сама Microsoft. Смотрите спецификацию Microsoft Office File Format Documents

Цитата
хотя обещания реализовать в соответствии с форматом OOXML компанией давались в процессе стандартизации

Вообще-то она реализована, хоть и с некоторыми ограничениями в Office 2010 подробности можно узнать из статьи Office’s Support for ISO/IEC 29500 Strict
Ограничения вполне объяснимые - комитет внес ломающие изменения (в частности исключил или изменил некоторые части), в исходный проект. И поддержка такого рода изменений - это не быстро.

Цитата
что в случае исчезнования OpenOffice, LibreOffice, Microsoft Office и проч. всегда можно при необходимости создать что-то свое

Вообще-то форматы ODF и OOXML не предназначены для длительного хранения. На самом деле они могут использовать для длительного хранения, но обычно для этого используются более простые в технологическом плане форматы, такие как TIFF или PDF/A - они гарантируют воспроизводимость на разных платформах, не содержат лишних элементов (в первую очередь элементов активного содержания таких как формы и скрипты) и довольно легко могут быть прочитаны и интерпретированы.
Форматы же ODF и OOXML - форматы оперативной работы. По хорошему, их срок существания должен быть в пределах 3-5 лет. И обычно так и есть, другое дело, что службы управления документами на местах должны иметь четкие рекомендации по переводу документов в длительное хранение.
А это весьма нетривиальная (по организации) работа.

Евгений
24.11.2011 17:30:30

мдя, произошел технический сбой в терминологии. смысл закладывался такой, что, заботясь о способах представления данных, потребитель в данном случае государство должно быть заинтересовано в тех форматах, которые не только описывают эти данные, но и в некотором смысле защищены от вольных трактовок со стороны вендоров, как это зачастую происходит с файлами *.doc, которые будучи созданными в одних версиях текствого редактора совершенно поиному открываются в других от того же вендора, а в случае с OpenOffice вообще помню заканчивались падением последнего (а бывало создашь в ворде 97 такой же файл, но с одной новой строкой в конце и всё хорошо). Все перечисленное может навести (и собсно наводит меня) на мысль о том, что doc - это отнюдь не фиксированный формат (!) и никак не может быть отнесен к стандартизированным форматам как по формальному признаку (внутренние стандарты СМК компаний не в счет, извините), так и по фактам вышеизложенным. Тогда, что же это за формат? Его бинарное описание я читал. Это конечно здорово, но...

24.11.2011 19:13:55

Цитата
осударство должно быть заинтересовано в тех форматах, которые не только описывают эти данные, но и в некотором смысле защищены от вольных трактовок со стороны вендоров

Увы, я не знаю ни одного более или менее сложного формата, который был бы избавлен от трактовок вендоров.
За примерами далеко ходить не надо: формат html, не смотря на свою простоту имеет массу возможностей по интерпретации того, как отображать разметку. Просто за последние годы проделана огромная работу по консолидации различными вендорами - как результат различия в отображении сайтов в разных браузерах все менее значимы.
Однако, стоит появиться новому стандарту (или новой версии) как снова всплывают различия. Думаю, это неизбежно.

Форматы офисных документов это очень сложные форматы. Многие разделы того же ODF до версии 1.2 были просто не описаны (причем такие важные моменты, как форматы представления формул в таблицах и внедрения ЭЦП в документ) - т.е. трактовать можно было как угодно! А версии 1.2 всего-то полгода от роду.

Я, конечно, далек от мысли, что разработчики стандарта исключили odt именно из этих соображений (хотя, кто знает...). Скорее они исходили из статистики форматов, ныне представленных в министерствах. Уверен, что doc там лидирующий формат. А это означает, что надо в первую очередь вписываться в существующую инфраструктуру, а не ломать ее.

Вот например, заменим мы формат .doc на odt и что прикажете делать со всеми уже имеющимися документами? Я несколько лет назад смотрел решения по автоматической конвертации массивов документов. Увы, они не отличались качеством.

24.11.2011 19:48:21

Цитата
Вот например, заменим мы формат .doc на odt и что прикажете делать со всеми уже имеющимися документами?


Ничего не делать - пусть остаются. Вопрос не в исключении doc из списка, а о включении в него odt.

25.11.2011 08:57:36

Для чего он там? Чтобы поднять стоимость?

25.11.2011 09:10:55

А для чего тогда стандарт принимали?
К тому же, правомерен симметричный вопрос - а для чего там doc? Чтобы стоимость поднять? smile:)

25.11.2011 09:27:10

Цитата
А для чего тогда стандарт принимали?

Не знаю.
Я в принятии этого стандарта никакого смысла не вижу.

Цитата
К тому же, правомерен симметричный вопрос - а для чего там doc? Чтобы стоимость поднять?

Нет, doc это, судя по всему, основной используемый сейчас формат используемый госорганами. Для его поддержки есть закупленное ПО и его просто уже очень много.
Логично, что в требования к СЭД включается поддержка этого формата.

Igor
01.12.2011 19:13:00

Закупленное ПО для поддержки doc, как Вы выразились, в соответствии с Распоряжением №2299-р запланировано заменить. Если оно к сроку исполнения, конечно, не станет свободным. А это вряд ли.

01.12.2011 19:18:22

Цитата
Закупленное ПО для поддержки doc, как Вы выразились, в соответствии с Распоряжением №2299-р запланировано заменить.

А вы можете привести цитату из указанного распоряжения или приложенного к нему плана мероприятий, где говориться о замене ПО?

Igor
01.12.2011 20:10:55

Вот всегда у нас так. Такой цитаты там нет. А в уголовном кодексе нет запрещения убивать на темной улице женщин в бежевых норковых шапках молотком без ручки.

Так понимаю, Вы полагаете, что Вас данное Распоряжение не касается. Ну и полагайте на здоровье.

01.12.2011 23:22:42

Цитата
Вот всегда у нас так.

И не говорите! За анонимным хамством скрывается невежество и популизм.

Между тем, если внимательно изучить постановление, на которое вы так опрометчиво сослались, то станет ясно, что оно предполагает своей целью создание предпосылок для появления свободного ПО в госорганах.Без него усвободного ПО просто нет шансов.
Ни о какой тотальной замене речь не идет в принципе.

Igor
01.12.2011 20:12:20

Кстати, "говориться" в данном случае без мягкого знака пишется. Изучите русский язык. Стыдно, уважаемый.

Леонид Аникин
25.11.2011 10:59:20

Прежде всего, полностью согласен с тем, что включить odt нужно.
Однако, мне кажется, что многие споры про форматы документов (ODF vs OOXML) идут как-бы по инерции. За последние время индустрия сделала огромный шаг вперёд: большинство вендоров поддерживают форматы друг друга (пусть и не на 100%). В MS Office можно сделать ODF форматом по умолчанию, а Google Docs поддерживает OOXML. Мне кажется, что для пользователей проблема перестала быть острой.
Кстати, в сентябре опубликован большой обзор (если есть время и желание читать большие документы на эту тему) http://pbokelly.blogspot.com/2011/09/revisiting-open-document-format-and.html

25.11.2011 13:08:21

Увы, эта перекрестная поддержка еще очень далека от совершенства.

В политическом плане включение odt может и имеет смысл. В практическом - нет. Для нормального отображения каждого из форматов придется поддерживать двойной набор ПО.

Евгений
24.11.2011 17:36:02

Исходя из других весьма спорных моментов в этом приказе, как например требование соответствия системы защиты ГОСТу (посмотрите его содержимое), я могу осмелиться и предположить, что работа была выполнена на скорую руку людьми некоторым образом далекими от систем электронного документооборота. вместо предъявления требований к достаточно конкретному спектру программного обеспечения требования дополнительно предъявлены к объекту информатизации, автоматизированной системе, системе защиты информации. в последнем случае вообще непонятно как соотносится 3 раздел с другими нормативными документами в частности фстэк. налито воды, фиг разберешься.

24.11.2011 18:49:52

Цитата
как например требование соответствия системы защиты ГОСТу

Я не знаком с ГОСТ Р 51275-2006, поэтому никак прокоментировать не могу.

Цитата
вместо предъявления требований к достаточно конкретному спектру программного обеспечения требования дополнительно предъявлены к объекту информатизации, автоматизированной системе, системе защиты информации

Вообще-то там довольно все четко:
- те части, которые являются юриздикцией СЭД, оставлены на откуп СЭД (например, разграничение доступа на документы, хранящиеся в СЭД).
- то, что силами только СЭД обеспечить сложно или вообще не возможно, предлагается решать комплексно - соответсвующим ПО и АО.
- дополнительно указываются ряд требований по резервированию и восстановлению информации.

Тут можно спорить о достаточности требований или наоборот слишком их высокоуровневости... Но называть их совсем непроработанными я бы не стал - все перечисленные требования для СЭД вполне логичны.

Евгений
25.11.2011 09:05:02

Формат ODF предназначен только для обмена информацией между различными офисными пакетами и др. приложениями

25.11.2011 09:24:21

И что?

Igor
01.12.2011 19:08:26

"А odt - это формат, повторяющий функционал doc или rtf. Его включение в требование об отображении имеет смысл если только ПО, которое продуцирует этот формат очень расспространено.
Похоже это не так".
Отчего же не так. Именно так. Microsoft Office работает с форматом ODT как с родным. С помощью плагина от Sun/Oracle (погуглите Sun ODF Plugin for Microsoft Office).

01.12.2011 19:31:24

Цитата
погуглите Sun ODF Plugin for Microsoft Office

Буду признателен, если вы приведете оригинальную ссылку.
Ибо по моим сведениям такого продукта более не существует, а значит ждать от него поддержки хотябы стандрта ODF 1.2 уже нельзя.

Igor
01.12.2011 20:05:45

Много мест есть. Ну вот тут хотя бы http://www.chip.de/downloads/Sun-ODF-Plug-in-fuer-Microsoft-Office_24293087.html, нажать кнопку Zum Download.

01.12.2011 23:13:26

О нет, найти некий дистрибутив непонятного происхождения я могу и сам.
Мне бы хотелось увидеть ссылку на сайт поставщика этого решения

Igor
15.12.2011 08:14:07

Вы правы, Михаил. Запрашиваемый файл с сайта Oracle (Sun), оттуда, где я его брал, убран. Тем вернее тезис об опасности проприетарного ПО: хочу - размещу, хочу - продам, не хочу - вообще закрою бизнес. Но это так, ворчание.

А выход тут http://http://odf-converter.sourceforge.net . В числе спонсоров проекта - компания Microsoft (ее роли: Funding, Architectural & Technical Guidance and Project co-coordination).

15.12.2011 10:22:38

Я знаю этот проект. Увы его статус мне не ясен.
Последние комиты в проекты (и вообще последние активности) были 1,5 года назад. Будет ли проект развиваться - я не уверен (например, сейчас он поддерживает только версию ODF 1.1, а уже принята 1.2). В свете того, что MS Office сейчас поддерживает ODF "из коробки", а Microsoft один из участников обсуждения стандарта ODF - это кажется мало вероятным.

Igor
15.12.2011 08:16:09

Два раза http набралось. Прошу скорректировать. Я грузил английскую версию.

Igor
01.12.2011 19:28:33

Хотя, в принципе, о чем спорить. Все указанные форматы поддерживаются СПО. Если за их использование не нужно будет что-то платить (а скорее всего, так и есть), ничего плохого - пусть будут.

Если идти от существующих де-факто потребностей пользователей, тот вот тут неувязка. Формат pdf - да, используется повсеместно. Формат doc - уже повсеместно уступает место docx (и надежнее, и экономичней). Формат rtf - практически не применяется. Формат tiff - сомнительно, если о сканах для документооборота говорить: он неэкономичен, чаще всего по умолчанию применяют bmp или jpg. И ничего не сказано об иных форматах: презентации, звук, видео. Почему бы данные документы не хранить в СЭД? Например, организации могут получить данные документы по email.

Возможно, фраза о форматах - лишняя в приказе. Надо ее убрать. Или заменить на "СЭД ФОИВ должна обеспечивать отображение стандартных форматов документов и связанных с ними объектов".

Михаил
11.12.2011 16:20:27

Цитата
Формат tiff - сомнительно, если о сканах для документооборота говорить: он неэкономичен, чаще всего по умолчанию применяют bmp или jpg.

ПФР начинает приём копий документов о работниках организаций (паспорт, трудовая, ...) в электронном виде. Требование - формат JPEG. Наш поточный сканер формирует файлы в сжатом TIFF, Размер файла в 5-8 раз меньше, чем JPEG, а качество существенно лучше - нет квадратиков при большом увеличении. Т.е. файл-сервер в ПФР может иметь меньшую дисковую ёмкость, однако они отказываются smile:(

Igor
15.12.2011 08:22:49

Минздравсоцразвития аналогично принимает документы в отсканированном виде (как можно пользоваться таким объемом информации в псевдоэлектронном виде, не могу себе представить). Иначе, как пародией на электронный документооборот такую схему назвать нельзя. Решением было бы применение ЭЦП. Но у нас есть все необходимые указы и приказы, а воз, как говорится, и ныне там. Потому что мелкие чиновники понимают - им никакое наказание за неисполнение не грозит.

А не надо меньше емкость. Иначе денег на обновление оборудование не потребуется.

Igor
01.12.2011 19:30:28

А то какую неделю пол-Интернета на ушах стоит, а проблема выеденного яйца не стоит.

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии