НОВЫЙ ЛЕКСИКОН

Александр Смирнов, Игорь Криворученко, Владимир Криворученко

Распространение ПК обуславливает постепенную, но неуклонную модификацию и замену документов и элементов технологий традиционного, человеко-ориентированного, или бумажного, документооборота на, условно скажем, компьютерно-ориентированные. Этот процесс не может не сопровождаться появлением различных вариантов (от отдельных программ до международных стандартов) новой терминологии в области так называемого "электронного" документооборота. Или "электронного документооборота".

Это незначительное различие в расположении кавычек делит всех работающих в данной сфере на два лагеря. Первые говорят о преемственности основных характеристик "бумажного" документооборота в его "электронном" варианте и настаивают на эволюционном характере перехода. Вторые считают, что "электронный документооборот" отличается от "бумажного документооборота" качественно и что при переходе от второго к первому неизбежны кардинальные, революционные изменения в привычных технологиях.

Полемика на страницах прессы и в Интернете продолжается уже давно. И, самое интересное, происходит она в отсутствие общепринятой и общепризнанной терминологии. Этот спор "тупоконечников" с "остроконечниками" мог бы продолжаться и далее, однако время практически бесконтрольного и относительно безобидного сочинительства терминов и определений в области документооборота проходит.

Наступает эпоха электронного законотворчества. Идея овладела массами и перешла в фазу практической реализации. Только в нашей стране десятки субъектов РФ порождают массу местных законов. На просторах СНГ появились и законы государственные. Все эти нормативные акты различаются областью применения, названиями, перечнем статей, внутренней структурой, наборами терминов, их определениями и т. д.

Совсем недавно, 23 апреля 2004 г., депутаты Государственной Думы РФ отклонили во втором чтении проект закона "Об электронной торговле". Почти трех лет, которые прошли с первого чтения, не хватило для квалифицированной подготовки текста документа. По мнению Дмитрия Черешкина, председателя правления Национальной ассоциации участников электронной торговли (НАУЭТ), в этом законопроекте было немало недоработок. "В проекте закона "Об электронной торговле" главным образом рассматриваются правила ведения самих торговых операций, а не внедрения информационно-коммуникационных технологий в торговлю (например, не определен статус электронного документа)", - отметил г-н Черешкин на пресс-конференции несколькими днями ранее (www.cnews.ru/newtop/index.shtml?2004/04/23/158235).

Посмотрим, как же определяется этот базовый термин (электронный документ) в законодательстве стран, подписавших межгосударственные соглашения о едином экономическом пространстве России, Украины, Белоруссии и Казахстана. Ведь единая трактовка этого понятия является необходимым условием обеспечения электронного взаимодействия (в том числе электронного документооборота и электронной торговли) абонентов стран-участниц.

Законы

На Украине предприняли попытку широкого подхода, что видно уже из названия закона: "Об электронных документах и электронном документообороте". Приведем определения некоторых базовых терминов, данные в нем.

Электронный документ - документ, информация в котором зафиксирована в виде электронных данных, включая обязательные реквизиты документа.

Обязательный реквизит электронного документа - обязательные данные в электронном документе, которые служат основанием для его учета и придают ему юридическую силу. Состав и порядок размещения обязательных реквизитов определяется законодательством.

Из этих определений, в частности, вытекает следующее:

- электронный документ - это документ (т. е. разновидность документа, а точнее, "электронный" документ);

- информация в документе должна быть зафиксирована (без пояснений, что это за процесс, на что он обращен и каков его результат);

- в нем должны быть обязательные реквизиты (состав и порядок которых будет определен особо).

Закон Республики Беларусь сужает проблематику, поскольку носит название "Об электронном документе". Толкование терминов здесь уже несколько другое.

Информация, зафиксированная на машинном носителе, признается электронным документом, если она: 1) имеет структуру, установленную настоящим законом, и содержит реквизиты, позволяющие ее идентифицировать; 2) создается, обрабатывается и хранится с помощью программных и технических средств; 3) может быть представлена в форме, пригодной для восприятия человеком.

Машинный носитель - это магнитный или лазерный диск, магнитная лента, и иные материальные носители, используемые для записи и хранения информации с помощью электронно-вычислительной техники.

Здесь электронный документ - это уже не разновидность документа, а новая сущность и соответствующий ей единый термин. Фиксация информации на машинном носителе неявно предполагает ее запись, но различия между записываемыми и перезаписываемыми носителями в законе не делается. Что касаемо обязательных реквизитов (а ведь именно с ними в первую очередь будут иметь дело программы анализа документов), то и здесь все оставлено на потом.

В соответствии с документом "Законы Республики Казахстан об электронном документе и электронной цифровой подписи" в Казахстане "...электронный документ - документ, в котором информация представлена в электронно-цифровой форме и удостоверена посредством электронной цифровой подписи". Здесь, как и в случае с Украиной, мы имеем "электронный" документ, но опять же со своими нюансами. Так, информация в документе не зафиксирована, а представлена.

А что же Россия? У нас, судя по названию федерального закона РФ - "Об электронной цифровой подписи", заявлены еще более скромные претензии. Речь идет лишь о подписи. Только подписи? А под чем? Правда, из чтения статей закона выясняется, что "...электронная цифровая подпись - реквизит электронного документа" и "...электронный документ - документ, в котором информация представлена в электронно-цифровой форме".

Итак, одно вполне конструктивное следствие из этого закона имеется. На настоящий момент он предписывает нам рассматривать "электронный" документ как разновидность "документа". Правда, далее цепочка обрывается. Какое из имеющихся и существенно различающихся в разных нормативных актах РФ определений понятия "документ" использовать - не указано.

Так, в действующем законе РФ "Об обязательном экземпляре документов" от 23 ноября 1994 г. базовым указан термин документ, определенный как "...материальный объект с зафиксированной на нем информацией в виде текста, звукозаписи или изображения, предназначенный для передачи во времени и пространстве в целях хранения и общественного использования".

Иная версия принята в законе РФ "Об информации, информатизации и защите информации" от 25 января 1995 г. Здесь: "Документированная информация (документ) - зафиксированная на материальном носителе информация с реквизитами, позволяющими ее идентифицировать".

Таким образом, в одном случае документ - это материальный объект с зафиксированной на нем информацией, а во втором случае это информация, зафиксированная на материальном носителе. Как говорится, "почувствуйте разницу"!

Терминологическую неразбериху можно наблюдать и в сотнях принятых на разных уровнях (от федеральных до субъектов РФ) законов и нормативных актов в сфере информатизации и работы с информацией, действие которых так или иначе распространяется и на электронный документооборот.

Ряд примеров можно продолжить, но и из приведенных выше ясно, что государства порождают вроде бы и близкие текстуально формулировки, но по сути сильно разнящиеся.

Становится понятно, что о практическом использовании электронных документов в отношениях между абонентами внутри РФ или при взаимодействии их с абонентами других государств можно будет говорить лишь после успешного решения непростых теоретических вопросов.

Подход

Терминологические вопросы весьма широко обсуждаются в прессе. Еще в [1] было подчеркнуто: "Многие проблемы в человеко-машинных системах можно решить лишь после создания и утверждения системы конструктивных, стандартизованных определений взаимоувязанных понятий, которые допускали бы их корректный перевод в определения объектов, а затем в алгоритмы и программы, поддерживающие электронный документооборот".

В достаточно серьезной по широте охвата статье [2] представлен обзор текущего состояния проблемы и сделана попытка ассимилировать концепции, высказанные в предшествовавших работах, например в [1, 3]. В ней заявлена и отчасти продемонстрирована системность подхода, введена новая терминология (далеко не бесспорная) и т. д. Однако и эта, и множество других опубликованных статей не сильно приблизят нас к конструктивному решению проблемы, пока не будет изменен сам подход к формированию терминологии, начиная с выбора точки зрения. Попытаемся взглянуть на электронный документооборот с "электронной колокольни".

В этом случае представляют интерес не описания понятий для абонентов - людей в рамках человеко-ориентированного документооборота, а их описания для электронных абонентов в рамках систем электронного документооборота. Ведь создавать термины, давать им определения и т. д. необходимо на языке не столько интуитивно понятном человеку, сколько являющемся надежной основой для реализации алгоритмов принятия решений электронными устройствами. Собственно основы этого подхода и примеры реализации уже были представлены в [1] и [3]. Но, чтобы не отсылать читателя к давним публикациям, мы ниже их еще раз напомним.

Однако сначала поговорим немного о терминологических нюансах, очень важных для последующего понимания.

Сущности как реального окружающего нас мира, так и виртуальной реальности отражаются и фиксируются мыслящим существом через наборы характеристик в виде представлений. В этом наборе характеристик наряду с частными, несущественными важно выделить необходимые, определяющие сущность и относящие ее к определенному классу.

Полный набор необходимых характеристик достаточен для выделения класса сущностей, которому соответствует понятие. Набор понятий вместе с их определениями, используемый в той или иной предметной области, называется терминологией.

Однако в реальности при проведении умозаключений человек зачастую пользуется именно представлениями. Их для практических нужд ему вполне хватает. Ведь общественное согласование полного набора необходимых характеристик, соответствующего каждому понятию, - дело весьма длительное и трудоемкое.

Вот и сейчас в сфере законотворчества, устанавливающего нормы электронного документооборота, мы наблюдаем продолжающиеся попытки построения терминологии на основе представлений. Но путь этот, предполагающий использование "очевидных" соображений и обобщений "по умолчанию", в данном случае приведет в тупик. И тут вряд ли помогут даже алгоритмы и программы искусственного интеллекта, появления которых еще нужно иметь терпение дождаться.

Приведем элементарный пример. Как правило, в обиходе синонимом человеко-ориентированного документа является бумажный. Но материал носителя данных не представляет собой ни необходимый, ни достаточный признак для отнесения документа к одному из классов. Представители старшего поколения еще помнят такие машинно-ориентированные ("электронные") носители, как бумажные перфокарты и перфоленты. А наши современники, использующие программы распознавания текстов, знают, что напечатанный на бумаге стандартным шрифтом текст практически безошибочно вводится в ЭВМ со сканера.

На самом деле объекты электронного мира (включая электронные документы), порождаемые и воспринимаемые электронными средствами, существенно отличаются от объектов реального мира, непосредственно воспринимаемых человеком. Электронный мир порождает необозримое для человеческого осознания число сущностей и их характеристик. Их распознавание и анализ опирается на алгоритмы совершенно другой природы. И все чаще им не находится аналогов в реальном мире, в привычной для человека трактовке на естественном языке.

Вместо набора интуитивно понятных человеку терминов, основанных на представлениях, и слабо формализованных определений необходима система взаимоувязанных, однозначно определенных терминов. Определенных на основе понятий и формулировок, которые выражены формализованным компьютерно-ориентированным языком, адекватно отражающим сущности электронного мира и допускающим (при необходимости) человеко-ориентированное представление и толкование. Разговор о таком подходе к терминологии "электронного" документооборота (или "электронного документооборота") долгий, посему будем двигаться постепенно.

Структура документа

Начнем с такого базового термина, как "электронный" документ. Указанная здесь расстановка кавычек задана законом РФ "Об электронной цифровой подписи", который предлагает "электронный документ" рассматривать как разновидность "документа".

А для определения понятия "документ" воспользуемся подходом, предложенным в [3]. "Документ - это зафиксированные на носителе (механизме поддержки) данные в знаковой системе и с заданной структурой, позволяющей отнести их к типу, описанному в системе существования, созданные ее абонентами (производителями) и ориентированные на определенные классы ее абонентов (потребителей)". Под абонентом будем понимать процессор (человека или ЭВМ), который обладает именем и адресом в системе существования.

Эта относительно краткая, ориентированная на человека формулировка должна быть уточнена, если предполагается использование "электронных" процессоров. Теперь структуру и содержание понятия должно описывать определение на ЭВМ-ориентированном языке, допускающем и представление, ориентированное на человека. В качестве такого языка вполне естественно использовать XML-подобный язык описания схем. Для облегчения восприятия дадим вместо чисто символьного графическое представление базовой структуры документа.

На схеме (см. рис. 1) представлены составные объекты или элементы (в прямоугольниках со значком в виде ромбика в левом верхнем углу), из которых строится иерархия структуры документа, и простые объекты, атрибуты (в прямоугольниках со скругленными углами, содержащих значок в виде кружочка), - им присваиваются конкретные текстовые значения. Значок "плюс" означает обязательное наличие по крайней мере одного такого компонента схемы, а вопросительный знак указывает на то, что компонента может и не быть.    

Рис. 1. Пример базовой структуры типичного документа

В качестве примера документа, соответствующего данному определению, можно привести очень упрощенную схему обычной почтовой открытки (см. рис. 2), имеющей на одном носителе два блока содержания.   

Рис. 2. Схема обычной почтовой открытки

Первый блок характеризует документ и абонентов в терминах, понятных таким системам верхнего уровня, как почтовая служба и государство. Он содержит (см. рис. 1.) конкретные значения атрибутов:

- содержание_тип - почтовая открытка РФ;

- потребитель_ссылка - адрес и ФИО адресата;

- производитель_ссылка - адрес и ФИО производителя (адресанта);

- содержание_управление_ ссылка - штемпели почтовой службы.

Если текст представлен на русском языке с использованием кириллицы, то атрибуты текст_тип и символы _тип должны иметь значения "русский" и "кириллица", но могут быть и опущены. В случае использования других языков и алфавитов применяются дополнительные регламенты.

Второй блок несет собственно смысловую нагрузку и попутно позиционирует документ и абонентов в системе отношений адресант - адресат (производитель - потребитель). Хотя формальных атрибутов такого рода в нем уже, как правило, нет, данный блок тем не менее в каком-то виде всегда содержит их, поскольку тип послания, стиль, почерк адресанта хорошо известны адресату. Если же содержание второго блока представляет собой извещение организации, например повестку в суд, то атрибуты адресанта в виде штампа и печати должны присутствовать обязательно.

Третий блок указывает на тип механизма поддержки. В данном случае атрибут содержание_механизм_тип будет иметь значение "человеко-ориентированный".

Подчеркнем, что в соответствии с приведенной на рис. 1 схемой каждый блок документа может в свою очередь содержать вложенные блоки. Так, исходное содержание нередко кодируется (к тому же и неоднократно), а итоговый результат представляется посредством единого механизма поддержки. Впоследствии потребители будут производить обратные преобразования по расшифровке. Элементарный пример - представление на открытке исходного содержания в форме транслитерации русского текста латинскими буквами. В этом случае укрупненная схема документа будет выглядеть, как на рис. 3.    

Рис. 3. Схема документа, использующего транслитерацию русского текста

Одной и той же базовой структуре соответствуют документы разного вида. Примером может служить документ, в котором механизм поддержки содержания не является единственным.

К этому типу документов можно отнести билет для проезда в метро, где данные о сроке действия, дате и времени прохода и т. д. фиксируются как на магнитной полоске, так и на бумаге (см. рис. 4). Соответственно и атрибут содержание_механизм_тип будет иметь значение "ЭВМ-ориентированный" и "человеко-ориентированный" для разных механизмов поддержки содержания.    

Рис. 4. Схема документа, использующего несколько механизмов поддержки

Читатель вполне в состоянии примерить и любое собственное определение на базовую схему (рис. 1), которая, хотя и не является достаточной, но вполне претендует на необходимость. А что касается схемы, гарантирующей достаточность, то ее обсуждение требует дополнительных знаний и усилий. Для иллюстрации этого тезиса попробуем слегка расширить базовую схему.

От представленной на рис. 1 схемы наша модификация (рис. 5) отличается единственным дополнением: элемент содержание_механизм содержит дочерний элемент содержание.    

Рис. 5. Расширение базовой схемы

Чтобы понять смысл этого расширения, давайте внимательнее присмотримся к самому распространенному виду документов - денежным знакам. Возьмем, к примеру, доллары. На протяжении нескольких последних лет их внешний вид, в том числе и разнообразные механизмы подтверждения достоверности носителя, ориентированные как на восприятие человеком непосредственно, так и опосредованно, через аппаратно-программные детекторы (вплоть до лабораторных экспертиз), изменился уже дважды.

Так или иначе каждый механизм поддержки характеризуется своим "содержанием", которое хотя и не является текстуальным буквально, но вполне допускает трактовку в терминах, эквивалентных понятиям "символы" и "текст". Например, отдельные параметры, характеризующие физико-химические свойства носителей (бумага, краски, металлические полоски и т. д.), могут принять значения 0 ("не соответствует") или 1 ("соответствует"). А получившийся набор этих параметров с их значениями даст нам "текст", по "содержанию" которого анализирующий процессор (человек или компьютер) примет решение о достоверности носителя, а следовательно, и документа.

В качестве упражнения для заинтересовавшихся предлагается достать из кармана любой денежный знак и составить его схему с использованием элементов и атрибутов последней базовой схемы.

Внимание механизмам поддержки

Как следует из приведенных выше схем, документ - это неразрывное единство содержания и механизмов поддержки. Далее можно рассуждать следующим образом: если человеко-ориентированное содержание зафиксировано на человеко-ориентированном носителе, то и документ - человеко-ориентированный (в просторечии - "бумажный"). Точно так же было бы логично считать, что если ЭВМ-ориентированное содержание зафиксировано на машинном носителе, то и документ будет ЭВМ-ориентированным (в просторечии - "электронным"). Подобным способом построены приведенные выше определения из законов разных государств. И все они не точны, как и дефектны системы электронного документооборота, построенные на их основе. В чем же дело?

Еще раз подчеркнем, что документ существует лишь в рамках системы более высокого уровня (метасистемы), под которой будем понимать систему, не только изначально включающую в себя свои подсистемы, но и объединяющую на дополнительных условиях другие независимые системы (в том числе и абонентов). Частным случаем ее является коммуникационная система, обеспечивающая передачу документов. Она, в свою очередь, входит в систему документооборота какой-либо организации, а та, в свою очередь... В результате мы все равно выходим на уровень поддерживающих и гарантирующих государственных структур - силовых ведомств, судебной системы, законодателей и т. д. Их усилия могут быть задействованы, например, если почтовая служба примет к передаче важное заказное отправление, которое в итоге не дойдет до адресата.

Следует обратить внимание на то, что механизмы поддержки не только документов, но и абонентов и систем могут быть как человеко-ориентированными, так и "электронными". В прежних системах документооборота и включающих их метасистемах все механизмы были человеко-ориентированными. Если бы все механизмы в них были ЭВМ-ориентированными, то их и следовало бы назвать "электронными".

Однако в современных реальных системах, как правило, представлены комбинации разных механизмов поддержки, для согласования же их необходимы вспомогательные интерфейсы, а также алгоритмы и технологии преобразования, гарантирующие однозначность и обратимость с точки зрения включающей ее метасистемы. Диалог пользователя с ЭВМ являет наглядный пример такого вида преобразования, которое, однако, вовсе не гарантирует ни однозначности, ни обратимости.

И не следует называть системами "электронного" документооборота все решения, основанные на компьютерном обмене файлами. Для таких "смешанных" систем нужно корректно конструировать служебные термины, описывающие присущее им разнообразие доступных механизмов поддержки. Заметим, что реально комбинирование механизмов поддержки не может осуществляться произвольно или исходя только из внутрисистемных критериев оптимальности. Нужно понимать, что система самого верхнего уровня, обеспечивающая документооборот (а это опирающиеся на законодательную базу институты государства, обеспечивающие его функционирование), в силу своей естественной инерционности накладывает существенные ограничения на реализацию парадигм "электронного" документооборота.

Еще раз подчеркнем, что традиционный документ - это неразрывное единство содержания и носителя. Вот в качестве носителя для человеко-ориентированных документов принята бумага, для машинно-ориентированных - например в упомянутом выше законе Белоруссии, "...магнитный диск, магнитная лента, лазерный диск и иные материальные носители, используемые для записи и хранения информации с помощью электронно-вычислительной техники". Но загвоздка-то в том, что зафиксировать (а именно это слово применяется в обсуждавшихся выше законах) данные можно только на таком носителе, как CD-R. А вот на магнитных носителях и CD-RW их можно и записать, и переписать.

А теперь представьте себе последствия подписания какого-либо финансового документа бесследно исчезающими чернилами. Или появления на нем нового текста со стандартным, неотличимым шрифтом. А ведь аналогичные ситуации сплошь и рядом встречаются при работе с так называемыми "электронными документами", их "оригиналами", "дубликатами", "копиями" и т. д. и т. п. Все построенные на основе перезаписываемых носителей системы "электронного" документооборота принципиально будут порочны до тех пор, пока не изменится кардинально соответствующая юридическая база.

Заметим, что человечество в своей истории не раз пыталось построить систему взаимоотношений, основанную на "устном соглашении". Но даже дополненная современными средствами фиксации звукового содержания, институтом свидетелей устного соглашения и тому подобными приемами технология эта так и не получила совершенного юридического обоснования.

Одной из причин является сложность фиксации изменений "устного соглашения" на этапах его жизненного цикла. Это касается как возможного изменения содержания и состояния носителя документа, так и метаданных, описывающих состояние системы верхнего уровня на момент внесения этих изменений. Дело в том, что и изменения, и сопутствующая им трансформация метаданных "размазываются" на разных фазах их жизненных циклов по различным механизмам поддержки, включая и всех абонентов. Например, сначала устное соглашение заключается в присутствии одних свидетелей, потом слегка корректируется в присутствии других, с которыми впоследствии что-то происходит, и т. д.

Поэтому любые попытки построить вместо "электронного" документооборота "электронный" аналог "устного соглашения", используя вместо "электронных" документов только их "электронное" содержание, должны по крайней мере учитывать этот опыт. Ни к чему хорошему не приведут и массовые действия по соединению в единой технологии "бумажных" документов и "электронного" содержания, сколько бы ни называли этих "кентавров" "электронным" документом. Перефразируя известную поговорку, можно заявить: "Скажите мне определение "электронного" документа вашей системы, и я скажу, каких неприятностей от этого вы можете ожидать".

А пока юридически безупречную систему, обеспечивающую документооборот с использованием электронных механизмов поддержки, можно построить только на базе оригиналов документов на не перезаписываемых, энергонезависимых и однозначно идентифицируемых носителях, все изменения состояния которых на протяжении жизненного цикла восстановимы для рассмотрения в рамках метасистемы более высокого уровня.

Безусловно, это накладывает определенные ограничения на структуру и функциональные характеристики таких систем документооборота. Следует разобраться с метаданными, с описаниями процессов и механизмов и т. д. Естественно, возникают вопросы об особенностях технологии, построенной на этой основе. Но об этом - в следующих статьях.

С авторами можно связаться по адресу: kvs_kvs@mail.ru.   

Литература

1. Смирнов А. Д., Криворученко В. С., Криворученко И. В. Еще раз о системном подходе к формулировкам. PC Wееk/RE, N 17/ 2000, с. 32.

2. Гадасин В. А., Конявский В. А. От документа - к электронному документу. Системные основы. М.: РФК-Имидж Лаб, 2001. -190 с.

3. Смирнов А.Д., Криворученко В.С., Криворученко И.В. Системный подход к формулированию определений информатики. PC Week/RE, N 18/1999, с. 16.  

Версия для печати