НовостиСобытияКонференцииФорумыIT@Work
Документооборот/ECM:

Блог

Главная проблема создания архива электронных документов – надежное управление архивом!

Андрей Колесов
12.11.2015 22:01:54

По мотивам опубликованного в начале недели поста Российские архивисты стоят на пороге "электронной революции" у меня состоялась в одной из социальных сетей дискуссия с представителем сообщества архивистов. В этом разговоре мой оппонент в который раз высказал известные тезисы "против электронных документов" в том плане, что до сих пор не понятно, как обеспечить их долгосрочное, а тем более вечное, хранение документов в условиях недолговечности электронных носителей и быстрой смены ПО (типа "как нам сегодня причитать файлы в DOS-Лексиконе").

Я в ответ сказал, что первой проблемы не существует как таковой: "Вы же делаете влажную уборку в квартире, как минимум раз в месяц? Вот и свой электронных архив копируйте с одного носителя на другой раз в пять лет, а надежность обеспечивайте за счет создания резервных копий в любом количестве экземпляров". В плане решения задачи "смены ИТ", то, имея в виду вечное хранение, конечно, нужно продумывать механизм преобразования форматов документов с обеспечением юридической значимости на уровне подлинника. Задача эта видится совсем не из разряда создания "общей теории относительности", вполне решаемая при желании (которого, к сожалению, нет). Более того, и задача поддержки унаследованных ИТ для хранение документа в исходном формате, видится совсем не столько "безнадежной". Во всяком случае по собственному опыту могу сказать, что я и сегодня могут работать со всеми файлами собственного электронного архива, начиная с 1989 года (не считал специально, но речь идет о сотнях тысяч файлов, причем это совсем не только файлы ТХТ!, но и, например, CHI, не говоря уже про графические изображения).

Но, опять же, даже по собственному опыту могу уверенно утверждать: основная проблема ведения архива электронных документов заключается совсем не вопросах собственно хранения и воспроизведения файлов. Главная проблема – управление архивом.

Поясняю этот тезис. У меня за все эти годы (четверть века) не было ни одной потери информации из-за физического повреждения носителей или отсутствия нужных для работы с ней приложений

Но были реальные опасности потери (точнее – были потери, которые решались за счет наличия правильной стратегии резервного копирования). Ситуация довольно обычная: во время очередной "перетряски" архива вы просто случайно удаляется нужные файлы.
Собственно, потери бумажных документов в личном архиве происходят чаще всего так же: не потому, что их съели мыши или залили водой соседи сверху, а потому что во время очередного удаления ненужных, случайно выбрасываются и нужные.

И вторая актуальная проблема – найти нужный документ в огромном информационном массиве. Фактически, это выглядит именно как потеря, от того, что где-то в большом лесу под каким-то кустом лежит нужный вам клочок бумаги – это, почти, то же самое, что потерять его…

Вывод: при организации электронного архива нужно уделить внимание первостепенное внимание качеству управления системой, которая бы свела к минимуму возможность человеческих ошибок.
И проработать систему резервного копирования с наличием схемы "откатов" к более ранним версиям.

Комментариев: 7

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии

12.11.2015 23:57:06

Цитата
при организации электронного архива нужно уделить внимание первостепенное внимание качеству управления системой, которая бы свела к минимуму возможность человеческих ошибок.

Разве кто с этим очевидным тезисом спорит?
Просто под "качеством управления системой" каждый понимает что-то свое...
Цитата

свой электронных архив копируйте с одного носителя на другой раз в пять лет,


Если речь идет о терабайтах или даже десятках терабайтов данных, то это не проблема. А вот каждые пять лет вручную перезаписывать сотни терабайтов данных -- занятие весьма ресурсозатратное...

13.11.2015 08:21:03

Я согласен с Андреем - главное иметь План управления данными в хранилище и План аварийного восстановления данных в хранилище (вплоть до того, что иметь копии данных в другом географическом месте).
В соответствии с этими планами должны быть предусмотрены как процедуры миграции данных для устаревших носителей и форматов хранения данных (документов). Это процедура должна выполняться при наступлении события, когда видно что для того или иного носителя прекращается выпуск устройств или новая версия ПО не поддерживает или поддерживает с ошибками старые версии подготовленных документов. А в плане управления данными должна быть информация о регламентных технологических процедурах, которые необходимо выполнять при хранении данных (создавать регулярно 3 копии (эталонная, контрольная и рабочая), работать только с рабочей копией, оценивать состав фонда с точки зрения носителей и форматов и планировать работы по миграции и т.д. и т.п.

13.11.2015 10:09:42

... И планы эти должны выполняться на автоматическом уровне. И даже, возможно, формироваться планы должны автоматически. Человек должен только контролировать процессы, но, разумеется, с возможностью в случае необходимости, взять управление на себя.

А вообще, я уже писал в предыдущем посте по теме: дело с архивами у нас сдвинется только, когда на место поколения современных архивистов придет новое поколение специалистов. Сегодня это должны сделать ИТ-специалисты. А уже потом им на смену придет новое поколение "ИТ-архивистов".
К сожалению, как я понимаю, вузы у нас до сих пор "клепают" "бумажных архивистов".

13.11.2015 10:04:17

Зачем же в ручную, для этого есть ПО по управлению архивами.

13.11.2015 11:11:59

Цитата
для этого есть ПО по управлению архивами.


Этими вещами должно заниматься не ПО по управлению архивами, а система управления корпоративными данными, среди которых могут быть не только архивные

13.11.2015 11:33:43

Управление корпоративными контентом и управления долгосрочными архивами - это разные дела.

13.11.2015 12:09:39

Цитата
Управление корпоративными контентом и управления долгосрочными архивами - это разные дела.


Если речь идет о физической сохранности даннных, содержащихся в архивах (а это -- один из видов корпоративного контента) -- то это не разные дела, а одни и те же.

А вот проблемы с долговечностью ЭЦП и долговечностью форматов файлов, содержащих документы, с проблемами физической сохранности данных имеют мало точек пересечения...

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии