НовостиСобытияКонференцииФорумыIT@Work
Документооборот/ECM:

Блог

Хранить вечно. 2.0

Андрей Колесов
07.12.2012 00:30:40

"2.0" – потому, что я только что прочел пост Алексея Воронина под названием "Хранить вечно". Так у него, в частности, есть такая цитата:

Цитата
Позавчера на Технологическом Форуме Hitachi 2012 лектор Боб Пламридж поднял в числе прочего эту интересную тему. Он насчитал на сегодня аж 2500 утерянных форматов, т.е. как я понимаю, 2500 программных приложений закончили свой жизненный цикл. И ценность данных, хранившихся в почивших форматах, стала нулевой.



Я в том посте начал, было, писать комментарий, но он стал получаться слишком большим, решил сделать этого пост.

Проблема известная. И на нее очень часто ссылаются апологеты бумажных документов.
Но, вообще, говоря, проблема совсем не новая (и для бумажных документов тоже) и давно известно, как решаемая.

Тут нужно сразу уточнить один важный момент: для понимаю человеком информации нужны соответствующие инструменты.

Считается, что удобство бумажного формата заключается в том, что таких инструментов не нужно. Достаточно иметь глаза. Хотя тут возникают инструменты - многим людям нужны еще очки.
Но на самом деле все сложнее: нужно еще иметь голову, что понять видимую информацию.

Простейший пример: вряд ли много россиян смогут понять содержание "Слова о полку Игореве" в его оригинале, на древнеславянском языке. Мы, современные жители страны, в большинстве своем, можем читать это произведение, только в "конвертированном виде" – в переводе на современный русский язык.

Идея очевидна (и давно реализуется и для бумаги): информация должна обязательно существовать в комплексе со средствами, с помощью которых человек сможет работать с информацией.

Если же мы не можем поддерживать существование инструментов, то информация должна быть преобразована в новые, поддерживаемые форматы.

Например, в 70-е года мои программы для M-6000 были на перфоленте. Нужно ли мне для работы (например, похвалиться делами перед детьми и внуками) с этим программами хранить еще и считыватель с перфоленты? Надо сказать, и в те годы – это было не очень надежное (мягко говоря) устройство, оно не только давало ошибки при считывании, но имело привычку рвать исходный носитель. На верхнем фото начала 80-х, за рукой как раз стоит считыватель (чешского производства), на нем – "сматыватель", а за ним – перфоратор (производитель перфоленты). Между считывателем и перфоратором – металлическая корзина, почти всегда полная испорченной перфоленты.

Так что же делать: хранить для работы информацией на перфоленте еще и считыватель? Или обойтись ручными способом, "глазами-руками-головой" перекодируя с дырочки на ленте в понятные символы?

Нет, конечно, же. Код тех программ в какой-то момент (в конце 70-х) перешел на магнитный диск ЭВМ СМ-1 (объемом в 2,5 Мб, железяка диаметром около 50 см), дисковод виден за спиной. Оттуда – на магнитную ленту, через которую попала в формат EC-ЭВМ, оттуда на гибкие диски "Электроники-60", а затем, в 1989 году, на винчестер IBM PC AT. И, кстати, с тех пор (23 года) хранятся в неизменном формате TXT, сменив при этом, как минимум десяток жестких дисков (при наличии, естественно резервных копий – сначала на дискетах, потом на CD, а потом и DVD).

Разумеется, для хранения "важных" документов все обстоит несколько сложнее, но в принципе – точно также. И сразу отметим, что такая, казалось бы, сложная процедура постоянного "преобразования", на самом деле намного проще (дешевле, надежнее), чем поддержка сохранности бумаги… Разумеется, в пересчете на единицу информации…

Если же говорить, о реализации архивов электронных документов с грифом "хранить вечно", то проблема заключается в том, что у нас в стране по этому поводу пока идут лишь одни разговоры, в то время, как другие страны уже давно эту задачу решили, или, по крайней мере, практически решают.
В качестве примера – реализация "Вечного электронного архива" в Эстонии: на октябрьской конференции ЭОС об этом очень интересно и конкретно рассказал руководитель этого проекта Сааревет Койт. Сообщений на этот счет с российской стороны (например, от Росархива) про эти дела не было.

Кстати, интересно: что по данной теме говорилось на прошедшей на этой неделе конференции "Инфодокум"?

Комментариев: 36

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии

07.12.2012 07:23:28

1. Вы приводите пример информационных объектов, ни для кого, кроме вас лично, не представляющих никакой ценности. А пытаетесь сделать глобальные выводы для совсем другой категории данных.

2. Если вы считаете, что роман «Преступление и наказание» - это всего лишь информация из 1086453 байт, а рукопись можно смело выкинуть, так и напишите. Рукопись, кстати, стоит (почему-то) больших денег, стало быть ценность представляет не только собственно записанная информация. Я привел это пример для наглядности, в общем случае, ценность любых документов на любом носителе – предмет экспертизы.

3. Если бы вашими программами собирался кто-то пользоваться в сколько-нибудь ответственных применениях, значительно больший интерес представляло бы не то, на каких они носителях, а вносились ли в текст какие либо изменения или нет. Тут, возможно, перфоленты внушали бы большую уверенность, чем ваши файлы .txt. Вот мы и вышли на основной предмет нашего блога - менеджмент документов. Включающий, конечно, и миграцию на новые носители.

4. Никаких апологетов бумажных документов в природе не существует. Это популистская полемическая выдумка, чтобы было удобнее спрямлять очевидные любому профессионалу загогулины. Если попробовать этот подход в технических науках – дурацкий колпак гарантирован через три минуты.

07.12.2012 08:42:11

1. Понятно, что я привожу упрощенный пример, который показывает принцип. Точно также, как известная механическая модель (у нас такая была в школе) показывала принцип функционирования солнечной системы (в чем ее отличие от системы Птолемея или схемы "не трех слонах, которые стоят на ките")

2. Ваши высказывания по 2. показывают, сумятицу в головах насчет понимания "что такое документ". С вашей точки зрения документом является и гитара Джона Леннона, которая тоже продается за немалые деньги, или валенки "маленького Ленина", в которых он бегал (или не бегал) когда-то. Все же нужно разделять информационное содержание и материальную реализацию. Поверьте: ценность произведения Достоевского для человечества заключается именно в "буковках", а не запахе бумаги, на которой была начертана рукопись. Это - две принципиально разные категории.

3. Понятно и то, что ценность документов (информации) бывает разной и потом нужно использовать разные методы по обеспечению ее "значимости". Я не буду сейчас вдавать в дискуссию в такой очень абстрактной поставновке вопроса, Но только обращу внимание на построение вашей фразы:
"Тут, возможно, перфоленты внушали бы большую уверенность..." Тут вы сами вольно или не вольно, обеспечили словом "возможно" для себе возможность (извините за каламбур) для отступления.

Так вот: что был говорить о достоверности документа, нужно иметь его. Это первый пункт.
Для перфоленточного документа нет предмета для обсуждения, поскольку нет таких документов, как таковых. Они просто не сохранились...

Давайте, решим наш спор по поводу перфоленты очень просто. Для меня стояла задача показать читателями, как решались задачи повышения эффективности кода на примере задач 20-летней давности.

И я это задачу решил - показал.

Вы можете показать нечто такое же на примере сохранившихся у вас или ваших знакомых программа на перфоленте или перфокартах?
Покажите такой пример, тогда и продолжим обсуждение.

09.12.2012 02:01:59

Кстати, уничтожать исторические артефакты никто тут не призывал.

07.12.2012 13:51:44

Вспомнил в этой связи одну любопытную конференцию в рамках выставки “Атомная энергетика и электротехника. Энергетическое машиностроение”, о которой мне довелось тогда писать . Приведу две цитаты из той статьи:

"Дело даже не в технической сложности сопровождаемых объектов и не в их потенциальной опасности, хотя важность этих факторов никто под сомнение не ставит. Здесь мы имеем дело с совершенно иными временными масштабами: цикл проектирования, строительства и продуктивной работы атомных станций измеряется десятилетиями, а вывод их из эксплуатации, как заявил начальник отдела Департамента по обеспечению вывода энергоблоков из эксплуатации концерна “Росэнергоатом” Федор Опаркин, может завершиться и через сто лет после старта проекта."

"И здесь мы снова возвращаемся к уникальным временным масштабам, с которыми имеет дело атомная индустрия. Владимир Зимин обратил внимание присутствующих на то, что сегодня бумажные чертежи из техдокументации на старые АЭС иногда просто не удается найти, но даже если они есть в наличии, то в силу механических повреждений не всё, что отображено на них, удается разглядеть и прочитать. Казалось бы, перенос документов в цифровую среду подобные проблемы решает, но если рассматривать их на столетнем временном интервале, возникают вопросы совершенно иного порядка. “Что будет с нашими БД через 60--100 лет?” — озадачил присутствующих г-н Зимин. И понять его логику можно. Конечно, никто сегодня не скажет, какие технологии будут применяться через столетие, но чтобы хоть как-то представить себе глубину возможных изменений, давайте оглянемся на сто лет назад. Мы увидим, что тогда еще попросту не было ни атомной энергетики, ни информационных технологий в их нынешнем виде."

07.12.2012 14:37:23

3. Проблема форматов существует, но является частью более общей проблемы – дисциплины учета и хранения данных для долгосрочного использования в (опять подчеркну) ответственных применениях.

Довелось соприкоснуться с таким сюжетом. Предприятие с очень уважаемым научно-практическим бэкграундом советского периода собиралось продать свое ПО (той эпохи) состоятельному заказчику, который планировал это ПО развивать и встраивать в свои решения. Софт работал без замечаний, на объектах это можно было продемонстрировать. Однако, потенциальный продавец не смог убедить потенциального покупателя в том, что его .TXT файлы – и есть то ПО, которое покупателю нужно. Продавец не предъявил убедительной культуры обращения с программным кодом, достаточной для оценки рисков покупателя многих десятков тысяч строк кода (стоимость контракта исчислялась десятками миллионов долл). Авторы ПО были не доступны (умерли, уехали, разбежались), т.ч. прикупить к программному коду какой-нибудь консалтинг с человеческим лицом было невозможно. Носители, на которых был записан исходный код никого не интересовали, сгодились бы любые. Сделка не состоялась.

Собственно, ECM/СЭД-проекты и являются элементом системного окультуривания информационной среды. В частности, поэтому непосредственный подсчет доставляемого ими эффекта (в процентах, см. C СЭД жить стало лучше и веселее. Но на сколько процентов? ) может быть затруднен или даже вовсе не осуществим.

07.12.2012 16:23:13

Да,то это очень хороший пример!

На самом деле, я тоже хотел привести аналогию из ядерной области.
Только с захоронением отходов (аналогия с архивами).

Традиционная схема свалки - свалили в яму, засыпали и забыли
С ядерными делами все иначе - безопасное (и экологические чистое) хранение - это постоянные процесс с постоянным совершенствованием технологий.
При этом мы не знаем, как именно будет хранить через 100 лет, но уверены, что методы будут.

Точно также по стоимости хранение и безопасности: в пересчете на 1 вырабатываемой энергии ядерное хранение - дешевле и чище.

Но на самом деле и "обычная свалка" - это далеко не просто "свалил и забыл", Это тоже процесс по поддержке свалка в безопасном состоянии.

11.12.2012 13:11:25

Атомной энергетики не было, а промышленное строительство было. Сейчас работают металлургические, химические и другие предприятия, построенные очень давно. Мне лично довелось иметь дело с архивами техдокументации 30-х годов, но есть и более старые. Еще можно вспомнить судостроение. У нас до сих пор в строю некоторые суда довоенного производства. А примеров полувековой давности просто много. Несколько лет назад мне рассказали историю о заказе на модернизацию танков Т-34, которые сохранились в какой-то далекой стране. Для всего этого нужна документация: проектно-конструкторская и технологическая, как минимум.
А про "буковки" есть забавная притча: "http://pritchi.ru/id_965".

11.12.2012 14:37:55

А к чему эта история? Да, архивы нужно хранить. Нужно ли хранить бумажные архивы в существующем виде или переводить их в электронный вид? Это надо обсуждать и решать с учетом всех факторов. В общем случае - конечно, нужно, может быть, не прямо сейчас. нужно ли при этом уничтожать бумажные? Что-то вполне можно, что-то - нет.
Но то, что все нужно со временем иметь и в электронном виде - это почти очевидно.

11.12.2012 22:20:24

Василь, за притчу спасибо. Раньше не слыхал. smile:)

А относительно приведенных вами примеров старой техдокументации, в том то и дело, что там все это время не менялся носитель/формат документации, и, что более важно, не менялось устройство чтения (человеческий глаз). В случае электронной документации изменяется, причем очень часто, и то, и другое. smile:(

11.12.2012 22:36:38

Притча замечательна еще и тем, что демонстрирует важные методические проблемы архивного дела. А именно - от использования копий документов вы все равно никуда не денетесь. Копии нужны!

Так вот электронное копирование гарантирует фактически 100-ю надежность и тождественность оригинала и копии. В отличие от бумажного варианта, в котором случаи, описанные в притче - встречают на самом деле.

19.12.2012 08:24:10

Да, конечно, сохранность электронного архива можно довести до любого заданного уровня.
Я хотел сказать о другом, и это касается как раз тождественности. Здесь есть 2 случая: документ изначально бумажный, либо документ изначально электронный. Чисто текстовые документы пока оставим для другого раза smile;)
В случае технических документов это две группы проблем. Что такое копия?
1. Бумага. Скан чертежа формата А0 - это прежде всего соответствующий сканер, дорогостоящий аппарат, допустимое искажение которого по всей ширине не должно превышать сотых долей миллиметра. Техника неизбежно изнашивается, искажение постепенно растет. В какой-то момент копия перестает быть тождественной оригиналу.
Для большого архива с большой историей это реальная проблема. Не буду углубляться в детали. Отмечу лишь, что это вовсе не просто и не дешево. И касается не разработчиков и интеграторов архивного софта, а прежде всего самих держателей архивов. Это существенный момент, о котором обычно забывают участники подобных обсуждений.
2. Электронные чертежи. Существует множество векторных форматов электронных чертежей, для каждого из которых существует некоторое количество версий, не всегда разработанных одним производителем. То есть номинально файлы могут иметь один формат, а фактически их невозможно показать одним инструментом. Теперь представим, что вам надо конвертировать некий устаревший формат в другой, поддерживаемый в настоящее время. У вас в архиве сотни тысяч, а возможно миллионы, чертежей... Вы находите или разрабатываете конвертер, который преобразует некий набор форматов в нужный. Вы уже поняли, к чему я веду smile;)
Кто сможет гарантировать ту самую тождественность? А?
И теперь самое время вспомнить, что все эти чертежи - не просто файлы каких-то форматов, а архивные документы, авторы которых могут быть уже недоступны. Да что авторы, самих КБ уже нет...
Ну вот, предисловие закончено smile:D Можно подумать о том, что такое документ и что такое копия.

19.12.2012 08:47:07

Прежде все, я должен пояснить свою позицию: никто не говорит, что проблема долгосрочного (тем более вечного) хранения документов простая. Да, непростая, да, возможно, даже очень сложная.
Но - уверено на 100% - решаемая.

Но дело в другом: решаемая проблема станет решенной только, если ее будут решать.
По-моему, это вполне очевидно.

А у нас, создается устойчивое впечатление, что вместо решения проблема идут только исключительно "кухонные разговоры о смысле жизни" (в ним я отношу и свои публикации).

А чем занимают те, кто должен заниматься электронными архивами? Посмотрите, хотя бы сюда, на вот эти высказывания товарищей из ВНИИДАДа - http://www.pcweek.ru/ecm/blog/ecm/4065.php. Извините, но это какие рассуждения на уровне каменного века...

19.12.2012 11:09:54

Да, Андрей, обсуждение ИнфоДокума я уже читал. Грустно, согласен smile:cry: .
Согласен и с тем, что задачу можно и нужно решать. Я только против изначального упрощения этой задачи. Ведь вся дискуссия "Что такое документ?" начиналась с утверждения, что все документы одинаковые. А в жизни мы видим, что с точки зрения способов использования и убедительности одинаковыми между собой можно считать только бумажные документы. Электронные документы, которые (да, согласен, это уже не предмет дискуссии) реально существуют, по многим параметрам отличаются не только от бумажных, но и между собой в зависимости от форматов файлов, способа хранения, условий хранения (сроки хранения, организация доступа) и других обстоятельств. Это касается, в том числе, и способов копирования при длительном хранении.
Я согласен и с тем, что государство должно организовать и обеспечить решение всех задач, связанных с эл. документами: созданием, оборотом, использованием, хранением... Иначе мы имеем тот... хм..., скажем, хаос, который имеем. Сейчас я имею в виду только электронные чертежи, но подозреваю, что в других областях хаос тоже присутствует.
А теперь представьте, что именно должно взять на себя государство. Допустим, некое госучреждение разработало замечательные нормы по форматам, процедурам, ответственности и т.п. вещам, касающимся электронной техдокументации. И что дальше? Как это обеспечить? Учреждение, разработавшее замечательные нормы, этим заниматься не может. Другие вообще не при делах.
В стране тысячи конструкторских контор, оснащенных сотнями программных продуктов в разных версиях. Многие конторы имеют собственные доработки этого софта, нестандартные библиотеки конструктивных элементов, технологии совместного использования. Кроме того, существуют другие тысячи держателей документов, имеющих собственные наборы софта, поскольку документы им приходят из многих разных источников.
И вот наши замечательные нормы вступают в силу. Что при этом происходит? При существующей сегодня организации дела - ничего. Все будут работать как раньше, засунув замечательные нормы в одно место...
Сегодня в государстве просто нет органа, который мог бы взять на себя "нормоконтроль" на всех стадиях. До создания такого органа я дожить не надеюсь, поэтому приходится смотреть на всё это с юмором.
А вот если бы какое-то авторитетное издание взяло на себя труд познакомить заинтересованную публику с зарубежным опытом... Нет, я не намекаю... Просто интересно, как в других странах отвечают на вопрос "Что такое документ?", и примерить эти ответы к электронным чертежам длительного хранения.
Как сейчас проблема решается в России? Вы снова скажете, что это каменный век, но другого способа сегодня не существует. А именно - двойное хранение. Хранится и бумага и электронные документы. Какой экземпляр считать первичным, каждый решаем для себя сам. Обычно первичным считается бумажный документ, поскольку содержит собственноручные подписи. Кстати, на чертежах ставится не одна подпись, а минимум две. Но их может быть и 4, и больше, в зависимости от организации работ. Соответственно, электронный экземпляр - копия, на которую никаких подписей не ставят. Это позволяет хоть как-то снизить затраты. При хранении бумажные подлинники плотно складывают в "сундуки", чтобы никогда не доставать, а размножают файлы.
Ну вот, кто сможет предложить что-нибудь получше, но так, чтобы можно было это принять в масштабах государства?
И снова: а как в других странах?

19.12.2012 11:15:25

О чем вы говорите, если, кажется, все государство у нас только и занимается, как борьбой с детсткой порнографией. Впрочем - не борется, только "ля-ля"...

19.12.2012 12:28:00

Вот именно, об этом и речь. Нашему государству, похоже, вообще ничего не нужно. Поэтому и интересно, как у других.

19.12.2012 21:04:21

Архивы и документооборот технической документации - это другая тусовка. Lotsia Soft участвовала в Docflow последний раз в 2008 году, а остальные (см. краткий список Разработчики конструкторских электронных архивов и документооборота ) не участвовали никогда. Хотя Consistent Software продавала инженерные сканеры и программно-организационные решения на их основе с середины 90-х годов, если память мне не изменяет.

О причинах разделения песочниц СЭД и PDM, может быть, как-нибудь выскажусь. Пока ограничусь небесполезными, надеюсь, в контексте данного поста, ссылками.

http://elarchivo.ru/?cat=11

http://www.cntiprogress.ru/seminarsforcolumn/13344.aspx

http://www.cntiprogress.ru/foreignsem/default.aspx

20.12.2012 11:49:17

Я не про тусовки, а про документы.
Собственно, исходным пунктом, с которым я не согласен, было утверждение, что "тождественность" документа и копии - это совпадение "буковок". Привел случаи, когда содержанием документа является именно его внешний вид. Привел случаи, когда многократное копирование с изменением формата угрожает той самой "тождественности". Вот и всё.
А тусовки в этой теме принципиально обсуждать не хочу. Это, действительно, надо открывать разные темы для разных видов документов. Суть-то проблемы именно в том, что они разные по сути smile:D
Соответственно, разные требования, нормы, технологии...
В приведенных ссылках мне интересно только объявление о семинаре, переслал его коллегам, у которых в 2013 году могут быть подобные проекты.
В остальных материалах по ссылкам я не нашел чего-то относящегося к данному обсуждению. Понятно, что бумажные документы надо сканировать, с этим никто и не спорит.

20.12.2012 12:53:03

Ну, извините великодушно.

Просто полезную вам информацию, если вы специализируетесь на технической документации, скорее можно найти в околоCADовской среде. Но, сколько мне известно, никакие государства управлением этой сферой не занимаются. Только стандарты de facto.

Безусловно, есть еше ведомственные стандарты - министерства обороны, энергетики, транспорта и т.п.

20.12.2012 13:46:10

За информацию спасибо, конечно smile:)
Тогда попутно вопрос "для отчета". Как вы считаете, технический документ - это документ? smile;)
И, конечно, я не про сканы с бумаги smile:D
Есть какой-нибудь подход для вечного хранения (с сохранением доступности) многофайловых многослойных документов, использующих библиотеки элементов?
Спасибо.

20.12.2012 13:59:55

Я не специалист в теме сложной технической документации, но ответ знаю. Точнее, знаю - где его искать: нужно обратиться к специалистам в этой области. В той же, какой-нибудь Швейцарии, знают ответ. И, наверняка, это не является гостайной.

20.12.2012 15:03:56

Цитата
В той же, какой-нибудь Швейцарии, знают ответ.


Думаю, в швейцарской аптеке или ресторане не знают. smile:| А на машиностроительной фирме, конечно, знают.

В Москве, надо сказать, та же самая картина. Есть вполне квалифицированные специалисты.

20.12.2012 14:57:52

1.

Цитата
технический документ - это документ?

Я бы предпочел говорить о контенте, который может в зависимости от прикладного контекста выступать в качестве документа, а может им и не быть, хотя при этом представлять определенную (даже довольно большую) ценность.

Я планирую подготовить небольшой пост на эту тему, С примерами. Но собираюсь долго. smile:o

2.
Цитата
многофайловых многослойных документов, использующих библиотеки элементов


Если я правильно понял, вы говорите о цифровых моделях, составленных из определенны образом логически скомпонованных примитивов векторной графики.

Надо понимать, что документ = информация + способ ее интерпретации + нормативная практика использования. См., в частности, предыдущий пункт.

Сама информация в виде нолей и единиц может храниться фактически вечно (нужно только своевременно проводить миграцию на новые носители). Способ интерпретации - это уже часто довольно массивное и сложное окружение (environment), не всегда чисто техническое (типа ПО и библиотеки элементов), иногда, например, интеллектуальное (многие просто не умеют читать чертежи). Соответственно, способ интерпретации более подвижен и подвержен рискам морального старения и утраты.

Наконец, нормативная практика еще менее устойчива. Комплект технологической документации может служить в качестве документации только в условиях строгой производственной дисциплины. Если вы знаете, что по факту производство от прописанной технологии отклоняется, техдокументация перестает быть документом, а превращается в тот самый (потенциально ценный) контент.

Так вот, если я вас правильно понял, ваш вопрос относился к способу интерпретации - вы хотели бы, чтобы он был "вечным". На практике, бессмертие цифровых моделей не достижимо, но к нему можно с достаточной уверенностью приблизиться, используя для моделирования наиболее распространенные в индустрии CAD форматы (их, обычно, не более одного-двух). Там есть специфические сложности, связанные с концептуальными различиями CAD-моделей, они не всегда конвертируемы друг в друга с полным сохранением логики проектирования, так что, если выбранный формат все же начнет умирать, может возникнуть большой объем квалифицированной работы по перемоделированию. Но все же, мне кажется, что основные тяжелые и средние CAD-системы уже достаточно застрахованы от такой напасти.

20.12.2012 17:20:09

Да, Александр... Ответ подробный, но очень обтекаемый. Всё это мне известно smile:(
Вот, возьмите любой реальный технический архив предприятия. Там к каждой единице хранения относятся как к документу или комплекту документов. И слово "документ" при этом понимается совершенно однозначно. Даже в конторах, где полный бардак, тех. документ имеет все обязательные реквизиты, в т.ч. как минимум 2 подписи: разработчика и приемщика с датами сдачи и приемки. В большинстве случаев подписей больше.
Из этого правила бывают исключения, касающиеся экстренных изменений и строительной исполнительной документации, но при сдаче в архив всё должно приводиться в порядок.
Исходя из всего, что мне довелось видеть, бумажный тех. документ - это несомненно документ. И это не зависит от прикладного контекста.
Про электронный контент - я с вами согласен, возможны варианты. Однако если мы допустим произвольное толкование этих вариантов, то исчезнет его важное свойство - быть основанием для выполнения технологических операций (бардак на производстве!). К примеру, рассмотрим механическое производство: чертежи, спецификации, тех. карты... Это документы? Безусловно. Иначе просто будет невозможно закупить материалы (денег не дадут), получить со склада детали, инструменты и т.д. Все расчеты по обеспечению делаются на основе конкретных документов, имеющих конкретные реквизиты, а не просто "контента".
В изделие вносятся изменения. По этому поводу выпускаются извещения. Это документы? Безусловно. Иначе невозможно будет заменить старые версии чертежей и пр. на новые.
Чтобы заменить документы надо изъять все учтенные копии старой версии и разослать учтенные копии новой версии. Учтенная копия - это копия чего? smile;)
Ну, наверно, контента... Шутю smile:D

Цитата
Если я правильно понял, вы говорите о цифровых моделях, составленных из определенны образом логически скомпонованных примитивов векторной графики

Любой сложный тех. документ можно назвать моделью. Давайте возьмем конкретный пример - план этажа здания. Это его full name, а айтишники могут в обиходе называть его чертежом, моделью и даже схемой... Если он делается с использованием CAD-инструмента, то обычно используются библиотеки элементов. В данном случае это двери, окна, лестничные пролеты, раковины, унитазы...
Поверх основного строительного слоя рисуют электропроводку, водопровод, канализацию, газовые трубы, вентиляцию... Получается многослойный документ.
Кстати, это всё касается не только строительства. Аналогично выглядит документация на электронные изделия, химическое производство и многое другое. Просто там другие "рисовалки" и элементы.
В итоге получается "контент", который полностью или частично выглядит как куча файлов. Частично - это когда какие-то примитивы лежат на сервере в базе данных. Например, в ГИСах это часто бывает. Но всегда можно сделать снимок - выгрузить конкретное состояние, возможно выборочно, в файлы. Опять мы приходим к тому же многофайловому... чему? По-моему, если это состояние должно стать основой каких-либо ответственных действий, то это должно быть документом. А по-вашему?
Можно сколько угодно обзывать его "контентом", но его придется формализовать так, чтобы он имел все существенные признаки документа. Иначе он не сможет быть официальным основанием ни для чего.
Цитата
документ = информация + способ ее интерпретации + нормативная практика использования

Конечно, но речь-то как раз о формализации, исключающей произвольное толкование "контента".
И, кстати, контент становится информацией только при наличии способности интерпретации.
... во завернул smile:o Однако это так.
Цитата
Способ интерпретации - это уже часто довольно массивное и сложное окружение (environment), не всегда чисто техническое (типа ПО и библиотеки элементов), иногда, например, интеллектуальное (многие просто не умеют читать чертежи)

Да, но к понятию "документ" это отношения не имеет, если есть возможность его обоснованно атрибутировать.
Думаете, архивариус - большой спец по чтению чертежей? smile:)
Бывает иногда, конечно. Иногда бывает всё, даже падение астероида, но тема обсуждения другая.
А дальше написано, извините, нечто совсем странное про то, что понятие "документ" зависит от практики производства smile:o
Речь шла о совсем простой вещи: документы, разработанные в "Компасе" самой старой версии, прошедшие 20 автоматических конвертаций в другие форматы, можно будет увидеть на экране и распечатать на бумаге в виде, полностью идентичном исходному? Есть такая уверенность?
Вот, айтишник, не умеющий читать документы, но имеющий зрячие глаза, хочет сравнить конвертированный векторный чертеж с древним растровым, имеющим тот же источник. Сможет он это сделать? А если этих документов миллион?
Вот и всё. Чего мудрить? Уверенность либо есть либо ее нет. Уверенности второй свежести не бывает.

20.12.2012 18:22:10

Надо различать файлы (или коллекции связанных файлов) и документы.

То, что вы видите на экране и хранится на жестком диске - само по себе не является документом. Равно как и не всякая бумага с подписями - документ.

Документами компьютерные объекты (состоящие из любого числа файлов) делают правила обращения с ними - создания, размножения, удаления, упразднения, внесения изменений, использования в производстве, сдачи в архив и т.п.

Если вы хотите пользоваться файлами как документами (электронными подлинниками), вы должны принять соответствующий стандарт предприятия и обеспечить соблюдение его требований на практике. Но это не очень просто. На многих предприятиях статус документа имеют бумажные документы с подписями, а файлы, из которых они распечатаны никакого официального статуса не имеют. Это позволяет пользоваться старыми докомпьютерными стандартами обращения техдокументации. Для поддержания порядка в электронном хозяйстве используются PDM-системы. В них, в частности, можно вести и учет бумажных экземпляров.

Я думаю, вы все это хорошо знаете. Это просто для уяснения исходной ситуации. А обсуждалась-то проблема морального старения и деактуализации приложений и форматов. Тут нет никакого универсального решения, тем более, насаждаемого государством. Нужно, по-возможности, избегать использования малораспространенных приложений и нестандартных форматов. Это было сложно на заре компьютеризации, но после 20 лет развития рынка в этом нет особой проблемы. "Компас" вполне заслуженная система, есть какие-то нарекания на конвертацию форматов?

Некоторые мысли я, виноват, просто не понял. Типа

Цитата
контент становится информацией только при наличии способности интерпретации


Для сличения векторной графики с растровой есть специальные программные средства, когда растровая картинка используется как подложка для прорисовывания векторных объектов.

20.12.2012 18:28:22

Совершенно без моего участия вышли на ключевой вопрос: что такое документы? smile:)

21.12.2012 10:50:09

Странная история случилась...
Вчера вечером я ответил на этот комментарий, но ответ куда-то пропал. Как такое возможно? smile:o
Попробую еще раз.
Обсуждалась не "проблема морального старения приложений и форматов". Обсуждалась совсем другая проблема.
Было заявлено:

Цитата
Так вот электронное копирование гарантирует фактически 100-ю надежность и тождественность оригинала и копии.

Я полностья согласился со словом "надежность" и усомнился в слове "тождественность". И весь дальнейший сыр-бор - вокруг массовой автоматической конвертации сложных документов из устаревших форматов в новые. Стандарты предприятия здесь вообще не при чем. Речь о том, что документация передается проектной организацией другой организации - исполнителю работ, эта документация официально согласуется несколькими организациями, в некоторых случаях - утверждается гос. органами. Какие стандарты предприятия? Какого предприятия?
Еще в пропавшем комментарии было предложение рассмотреть реальную ситуацию из недавнего прошлого. Рухнуло здание аквапарка, следователи собирают доказательную базу для передачи в суд. Что здесь будет входить в доказательную базу? Контент? На какой момент? Где его брать? С момента сдачи аквапарка в эксплуатацию много времени прошло. А если он был построен на фундаменте снесенного здания, использует существовавшие ранее коммуникации, в проекте использованы результаты предыдущих изысканий и т.п., то в документации могут присутствовать документы за несколько десятилетий.
Мне представляется, что строители руководствовались не контентом, а именно документами. И рассуждения про то, что я вижу на экране и на бумаге - не документ, не будут интересны ни следователю ни суду.
Цитата
Нужно, по-возможности, избегать использования малораспространенных приложений и нестандартных форматов.

Хороший совет. Только кому он адресован?
Вот если бы государство, которое не обязано насаждать универсальные решения, все-таки занялось стандартизацией и организовало контроль... Есть же в строительстве государственная экспертиза! Почему бы не включить в нее и контроль форматов электронных документов? Ну, так, для начала. Надо же с чего-то начинать.
А вы всё про софт... про способность понимать увиденное...
Пока что мы не можем понять даже предмета обсуждения - "Хранить вечно" smile:cry:
Не просто копировать файлы. Речь об архивах документов. Или нет?

21.12.2012 12:16:17

Василь! У меня есть предложение:
Сформулируйте некоторые итоги этого разговора, определите ключевые вопросы, которые интересно обсуждать и опубликуйте их в виде нового поста в этом блоге (дав ссылку на этой пост).

Дело в том, что пост имеет некоторое время жизни (несколько дней), когда он находится в поле внимания. Новый пост прочитают читатели и т.д.
Если у вас есть вопрос по механизму публикаций - напишите мне в личку, kolesov@pcweek.ru

Вопрос с "тождественностью" - это интересная тема. Но мы тут упремся в философскую трактовку документа. Не определившись "зачем нужны документы", мы не решим вопроса с тождетственностью.

21.12.2012 12:37:50

Хорошо, Андрей. Постараюсь обобщить.
А тождественность копии я понимаю так же, как и Вы - сохранение в копии всей существенной информации. Здесь есть аналогия с переводом официальных документов на другие языки.
Существенность информации я понимаю в чисто архивном смысле. Это можно будет обсудить подробнее.

21.12.2012 12:43:40

Тогда совет "опытного блогера" smile:)
1. Не затягивайте. "Куй железо..."
2. Не нужно написать "все-все-все". Оптимальный размер поста - 1-2 тыс. знаков.
3. Отличие поста от статьи, в частности, именно в том, что можно писать частями. Фактор времени - самый важный.

21.12.2012 13:46:14

Постараюсь.

21.12.2012 12:56:36

1. Вся эта ветка родилась из размышления о бренности форматов. См. в начало страницы.

Цитата
насчитал на сегодня аж 2500 утерянных форматов


2. Утверждение

Цитата
электронное копирование гарантирует фактически 100-ю надежность и тождественность оригинала и копии.


принадлежит не мне, я с ним точно так же как и вы не согласен. Замечания и возражения следует адресовать автору.

3. Пример с аквапарком (а ранее, с объектами атомной отрасли) очень удачен: он хорошо иллюстрирует тот факт, что дело, как раз, не в форматах, а в стандартах обращения документов.

При любом разбирательстве будут изучаться документы. Если проектант или эксплуатант утратил оригинальные бумажные документы, это уже – серьезное нарушение. Если он заменил их изготовленными самостоятельно электронными экземплярами, он должен сослаться на основание для такой замены (это и есть стандарт предприятия или какой-то другой утвержденный регламентирующий документ). В соответствии с этим стандартом предъявленный при разбирательстве электронный объект должен допускать экспертизу подлинности и аутентичности содержания. Формат – дело второстепенное. А вот упомянутая вами тождественность содержания оригинала и предъявленного электронного объекта – критически важна. Она и обеспечивается организационно-техническими мерами, зафиксированными в стандарте. За время жизни техдокументации (С.Свинарев говорил о десятках лет) таких стандартов, скорее всего, придется выпустить не один, а несколько.

4. Я писал «есть еще ведомственные стандарты - министерства обороны, энергетики, транспорта и т.п.». Строителей отнес к «и т.п.», виноват. Наличие этих стандартов облегчает обращение документов внутри ведомства. С тем, что для проведения государственной экспертизы в строительстве была бы полезна стандартизация порядка обращения документов в электронном виде (это не только форматы) – полностью согласен.

21.12.2012 13:44:16

Хм, долго же мы идем к одинаковому пониманию темы smile:D
Пост Алексея Воронина использован здесь лишь как повод:

Цитата
Проблема известная. И на нее очень часто ссылаются апологеты бумажных документов.
...
Разумеется, для хранения "важных" документов все обстоит несколько сложнее, но в принципе – точно также. И сразу отметим, что такая, казалось бы, сложная процедура постоянного "преобразования", на самом деле намного проще (дешевле, надежнее), чем поддержка сохранности бумаги…
Если же говорить, о реализации архивов электронных документов с грифом "хранить вечно", то проблема заключается в том, что у нас в стране по этому поводу пока идут лишь одни разговоры, в то время, как другие страны уже давно эту задачу решили, или, по крайней мере, практически решают.
В качестве примера – реализация "Вечного электронного архива" в Эстонии... Сообщений на этот счет с российской стороны (например, от Росархива) про эти дела не было.
...
Кстати, интересно: что по данной теме говорилось на прошедшей на этой неделе конференции "Инфодокум"?

Эти несколько фраз полностью определяют тему. Документы... документы... и еще раз документы.
И еще я не нашел, где это было:
Цитата
4. Я писал «есть еще ведомственные стандарты - министерства обороны, энергетики, транспорта и т.п.». Строителей отнес к «и т.п.», виноват.

В смысле - то что в кавычках? В моем экземпляре коммента этих слов я не увидел.
А это совсем интересно:
Цитата
При любом разбирательстве будут изучаться документы. Если проектант или эксплуатант утратил оригинальные бумажные документы, это уже – серьезное нарушение.

Приехали...

21.12.2012 13:54:46

Цитата
Эти несколько фраз полностью определяют тему. Документы... документы... и еще раз документы.

Потому и надо срочно начинать новый пост. Иначе нужно будет на этот пост устанавливать Documentum для управления написанным тут smile:)

20.12.2012 17:50:41

Древний анекдот в тему:

Цитата
Шпион утащил документацию на новейший советский танк, переправил своим заказчикам. Там по этой документации всё сделали, и получился паровоз царских времен. Дали они шпиону по шапке и объяснили: ты утащил основной комплект, а изменения оставил. У русских самое главное - изменения .

Вопрос на засыпку: что утащил шпион?
А действительно - что: контент? Паровоз-то они построили! Выходит, что это нормальные документы, только не те smile:D

20.12.2012 18:27:34


Как я помню этот анекдот:
Первый раз - авомобиль полный документацией
Второй - вагон
на третий раз шпион украл самого конструктора.
Он говорит: у нас еще целый эшелон доработок... smile:)

20.12.2012 19:10:54

Там много вариантов, на каждом предприятии свой.

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии