НовостиСобытияКонференцииФорумыIT@Work
Документооборот/ECM:

Блог

К вопросу о необходимость "эталонного доверенного ПО" при работе с электронными документами (файлами)

Андрей Колесов
07.10.2015 09:49:32

Позавчерашний пост Существует ли на практике проблема форматов файлов-документов вызвал дискуссию, которая была не только активной, но на мой взгляд весьма результативной. Это был нечастный случай, когда оппоненты, которые поначалу высказывали, чуть ли, не диаметрально противоположные мнения, пришли в итоге к взаимопониманию по основным принципиальным вопросам. Отмечу, что параллельно шло обсуждение поста в ECM-Фейсбук-группе. и там оно было тоже активным и результативным. Я планирую написать некий текст, где постараюсь сформулировать "резюме" и отталкиваясь от этой "ступеньки" с участием уже сформировавшейся команды и новых экспертов продолжить обсуждение этой важной темы. Имея в виду формулировки очередного резюме, чтобы у нас получалось не просто "поговорить", а некий практический "сухой остаток".

А сейчас я хочу сказать о другом важном аспекте темы, который обозначил в своем комментарии Вадим Малых:

Цитата
Вот вам реальная проблема. Есть такая ECM система - Alfresco. Она имеет удобную функцию - может отображать содержимое файлов непосредственно в окне браузера. Для этого она на своем сервере преобразует файлы в формат PDF. Делает она это при помощи LibreOffice.
Таким образом, загрузив в нее файл doc или docx, на экране можно увидеть совсем не то, что на самом деле в документе. А если вы смотрите его перед тем как подписать и, например, видите число $1000, и с легкостью подписываете документ, а там на самом деле $1000000000? Это проблема?


Да, такая проблема есть.
И тут нужно сказать, что позавчерашний пост – это только часть написанного мной текста. Но из первого варианта текста я убрал один аспект, оставив его "на потом", чтобы не перегружать пост (там и так было сформулировано достаточно вопросов).

В результате в опубликованном варианте я привел три проблемных варианта ситуации при операции "открытие файла" с помощью некоторого приложения

Цитата
1. С таким расширением у вас на ПК вообще не связана ни одна программа.
2. Программа, есть, но открыть файл она не может
3. Она открывает файл, но вы наглядно видите, что она отображает его содержимое как-то не очень адекватно.


А в начальном варианте был еще четвертый пункт (как раз его я решил на время убрать).

4. Все внешне выглядит вполне адекватно, но все же возникает вопрос: соответствует ли то, что вы видите на экране или на распечатке, тому, что находится в файле на самом деле?
Этот как раз та проблема, о которой написал и Вадим Малых.
В понедельник я ее отложил "на потом", так как следует рассмотреть отдельно, хотя бы потому, что мне за многие годы освещения темы "электронные документы", она мне, кажется, ни разу не встречалась в многочисленных разговорах о документах, но при этом проблема видится вполне реальной и весьма актуальной.

Например, у вас есть DOC (PDF…) в котором вы у себя на ПК видите некоторое одно содержание, а придя с этим файлом в суд и используя там средства суда, оказывается, что там записано что-то другое. Можно представить себе и другие сценарии на эту тему.

Сразу возникает вопрос: а какому средству должен верить суд? Какое средство работает правильно (Word 98, Word 2013, LibreOffice или что-то еще)?

Это тема мне видится интересной и важной сама по себе. Мне кажется, что задача эта может решаться путем созданием сертифицированных, эталонных экземпляров ПО, которые будут выступать такие "доверенными средствами". При этом речь идет совсем не о том, чтобы все должны были пользоваться именно этим средством, а в том, что на этом эталоне все имели бы возможность проверить (в случае необходимости) свои собственные средства и файлы. Ну, что-то вроде "контрольных весов", которые стоят у администратора рынка, где вы можете проверить вес купленного продукта…

Кстати, реализация такого эталона в виде сертифицированного доверенного сервиса видится оптимальным вариантом. Кстати, у нас в стране с конца 19-го века (создана по инициативе Д.И.Менделеева) есть Палата мер и весов – создание таких эталонов софта и сервисов вполне входит в круг ее задач.

Во всяком случае, мне представляется полезным (или даже необходимым) создание некоторого Фонда эталонного ПО (именно для визуализации содержимого электронных документов), с помощью которого, в том числе, решались бы недоразумения по поводу возможных разночтений электронных документов. Разумеется, для такого ПО нужно и ссответствующей аппаратно-технического обеспечения (что программу можно было запустить на выполнение).
Наличие такого Фонда необходимо и для решения другой актуальной задачи – долгосрочного хранения электронных документов и обеспечение возможности работы с ними. Собственно госархивы должны в своей работе использовать именно такие "эталонные" приложения, в том числе, с их помощью проверять все принимаемые на хранение документы.

Вот такая идея. Мне кажется, - вполне очевидная и достаточно простая в реализации. А реализация – очень нужная.
А вы что думаете?

Комментариев: 12

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии

07.10.2015 14:45:09

Тут много вопросов. Эталонное ПО конечно нужно.
Пример - сейчас уже узаконили требование к формату электронных документах в гос. органах (при обмене между ними) - PDF/A-1. Это не просто PDF (есть и другие PDF) и даже не просто PDF/A (есть еще 2 и 3).
Вопрос - каким образом я должен проверить, что сгенерил именно PDF/A-1? Раз это требование утвердили приказом - вы дайте инструмент проверки. Потом при сдаче в архив его проверят и скажут "Это был не Нескафе". И что делать?

Что касается описанной ситуации, не очень понятно как тут эталонное ПО спасет. Работаем то мы не в эталонном ПО, а в обычном. Понятно, что у документа есть 2 сущности - байтовое представление и то что мы видим. Но вы, как автор документа, писали и видели одно. А эталонное ПО (в суде, т.к. у вас его нету) покажет потом другое. И кто верблюд?

07.10.2015 15:02:30

Верблюд - не ваше ПО, которое не эталонное smile:-)

Потому и нужна реализация эталонного ПО в виде общедоступного сервиса, хотя тут тоже есть масса разных нюансов.

Хотя, возможно, мы преувеличиваем проблему. Мы же пользуемся в жизни рулеткой, часами и пр. А где гарантии, что они соответствуют эталону? Гарантий таких тоже нет... А вот иметь бы эталонный сервис с часами было бы ОЧЕНЬ полезно!

08.10.2015 13:04:33

Сертификация "обычного" ПО на соответствие эталонному - спасёт. По отношению к эталонному "обычное" может иметь кучу дополнительных возможностей, быть удобным, красивым, сколь угодно коммерческим и так далее, но главное - оно должно формировать стандартный формат тогда когда это требуется.
И да - почему бы сертифицированному доверенному сервису не завести себе общедоступный веб-интерфейс, как это теперь в порядке вещей? Чтобы кому надо мог бы проверить свои файлы на соответствие? Один файл бесплатно, много - за умеренную плату. Заодно всё и окупится.

Donat Lipkovsky
07.10.2015 16:57:21

Цитата
Есть такая ECM система - Alfresco

Эталонное ПО, как идея достойна рассмотрения. Но в конкретном примере с Alfresco, как она нам поможет?
Исходный документ всё равно загружается в Alfresco и преобразуется там движком libreOffice.
Есть разные подходы к решению проблем. Одна из них стандартизация ПО.
Применительно к вышеозначенному примеру, я подозреваю, что господа используя СПО Alfresco внутри компании применяют MS Office <такой-то версии> судя по расширениям файлов. По логике вещей (так как Alfresco использует движок LibreOffice) им надо пользовать и внутри компании его же и изменить формат на .ODS, .ODT. Кроме этого желательно иметь версию движка LO одинаковую и для Alfresco и для внутреннего потребления.

08.10.2015 16:20:42

Точно, в примере имеет место скорее проблема порядка и/или дисциплины. Действительно, могли же договориться для Alfresco выгружать в ODT. На все сто процентов тоже не гарантирует, но хотя бы вероятность проблем точно уменьшится.
Другое дело, что доступный эталон реализации OOXML мог бы помочь доработке движка LibreOffice. Тоже как бы польза.

08.10.2015 11:32:08

Думаю - да.
Привходящие вопросы. Возможно ли в принципе в качестве эталонного ПО принимать частную коммерческую реализацию некоторого коммерческого стандарта? Сейчас так, де-факто.
Или всё-таки действительно стандартизация ПО, включающая эталонную реализацию доступную для (более-менее) свободного использования и повторения?
Далее. Эталонная реализация тоже будет содержать ошибки (куда без них?), их потребуется исправлять. Исправлять на соответствие описанию стандарта, разумеется. Тогда должна быть заранее заложена возможность исправлений без нарушения каких-либо договорённостей неких третьих лиц и прочих лицензионных соглашений кого-то с кем-то.
Жизнь меняется, вероятно появление новых требований, не предусмотренных при разработке первоначального варианта стандарта. И стандарт, и его эталонная реализация должны быть доступны для пересмотра также без нарушения прав третьих лиц - это вопрос о праве интеллектуальной собственности, которое одни отрицают а другие считают незыблемым.
Идея с Комитетом по стандартизации в качестве хозяина описания и Палаты мер и весов как ответственого за эталонную реализацию действительно выглядит логично. Что-то в этом есть, это надо обдумать.

09.10.2015 13:25:40

У эталонного ПО смысл, по-моему, другой - это эталонная реализация (reference implementation). Т.е. это ПО не для повседневного использования, а для того чтобы разработчики промышленного ПО могли проверять, правильно ли они реализовали некоторый стандарт.
Действительно - мы же не заставим всех пользоваться только этим эталонным ПО (это будет монополия чистой воды).

А для проверки, правильно ли работает какое-либо ПО (в данном случае, правильно ли ПО отображает документы в формате pdf) нужна система тестов. Здесь это может быть набор демо-файлов, которые тестируют максимум функциональности, заложенной в стандарте pdf и вид эталонных экранных форм, соответствующих этим демо-файлам и с которыми можно сравнивать то, что отображается на испытуемом ПО.

09.10.2015 13:45:17

Я понимаю, что термин "эталонное", возможно, не очень удачное (хотя мне кажется - вполне подходящее для данного случая).
Для решения очень простой задачи: для его использования в суде, при разрешении конфликтов по трактовке электронных документов.


И у меня в после речь идет именно об эталонной реализации, а не процедурах проверки ПО.
Хотя оно и для этой функции подойдет.

09.10.2015 14:06:33

Я тоже подумал о решении вопросов в суде - если у суда возникают вопросы к корректности ПО.
В таких случаях суд обычно привлекает экспертов.
Для проверки эксперт может воспользоваться не эталонным ПО (для которого никто не доказал, что там не имеется ошибок), а например, продемонстрировать результаты работы двух-трех вариантов ПО, разработанных разными вендорами.

09.10.2015 14:16:40

Зачем нужны эксперты там, где можно обойтись без них?
Эксперты нужны в каких-то более сложных случаях. Зачем из простого делать сложное?

09.10.2015 14:30:16

Я думаю, что любой судебный работник сможет только прочитать документ или посмотреть/прослушать видео.
Анализ корректности ПО он на себя ни в коем случае не возьмет, и в любом случае потребует пригласить технического эксперта.

09.10.2015 16:07:39

Поясню: разумеется, такую экспертизу будет делать не судья, а эксперт. Но одно дело, если эксперт будет использовать стандартные средства, а другое - если он будет каждый раз делать специальные исследования.

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии