ОСНОВЫ

Что такое электронные данные, сведения, документы в терминологии информатики

Александр Смирнов, Игорь Криворученко, Владимир Криворученко

В силу разных причин, Чаще внешних, организации приходят к решению автоматизировать свою работу и внедрять современные информационные системы. Дело это сложное и дорогостоящее, а положительный результат отнюдь не гарантирован. Во многом он определяется тем, какая из предлагаемых на рынке систем будет использована в качестве прототипа. Ведь каждая организация имеет свои особенности.

Существует несколько путей решения этой задачи. Можно ориентироваться на рекламу и консультации организаций, торгующих подобными системами. Можно воспользоваться услугами консалтинговых компаний, в задачу которых входит и предварительное обследование объекта автоматизации. В конце концов, можно заключить договор на установку и сдачу информационной системы “под ключ” с последующим пожизненным сопровождением. Однако для начала мы предлагаем разобраться с базовыми понятиями, используемыми в системах документооборота вашей организации. Составьте перечень этих понятий вместе с их определениями, а затем посмотрите, как они соотносятся с понятиями и определениями в словарях-справочниках предлагаемых автоматизированных систем.

В статье “Системный подход к формулированию определений информатики” (см. PC Week/RE, № 18/99, с. 16) предложен минимальный начальный набор, включающий следующие понятия: данные, сведения, сообщения, документы, информация, знания, система, асинхронные и синхронные системы.

Если в вашем перечне этих терминов нет, то не существует и языка, на котором вы могли бы корректно изложить свои потребности, а следовательно, нет и подходящего для вас программного продукта. В этом случае следует серьезно подумать, прежде чем довериться разработчикам АСУП или КИС в надежде на то, что ваша организация успешно “прогнется” под требования внедряемой системы. Если же и в ее словаре указанный набор понятий отсутствует, то, вероятно, успешно решая внутрисистемные проблемы, она не всегда сможет корректно взаимодействовать с внешними системами.

Возможна и иная ситуация, когда понятия в системе определены. Тогда советуем сравнить их определения с изложенными в опубликованной ранее статье. Расхождения означают, что рано или поздно проявятся и соответствующие проблемы.

В данной статье мы уточняем определения предложенных выше понятий с целью облегчить выбор конкретного, ЭВМ-ориентированного, или, как принято говорить, электронного механизма поддержки объектов, им соответствующих. В повседневной практике широко используются термины электронные данные, сведения, документы и т. д.

Актуальность этой тематики обусловлена тем, что в автоматизированных системах управления для принятия решения на основе информации, сохраненной в базах данных, все чаще используются электронные механизмы (ЭМ). Широко употребляется и термин “электронный документооборот”, хотя системы взаимоувязанных, конструктивных, общепринятых понятий и определений, к ним относящихся, не существует. В силу этого ответственность за адекватность перевода слабо формализованных, человекоориентированных определений всегда возлагалась на плечи разработчиков разных систем. Отсюда и различия в трактовке понятий, существенно усложняющие организацию межсистемного взаимодействия.

Многие проблемы в человеко-машинных системах можно решить лишь после создания и утверждения системы конструктивных, стандартизованных определений взаимоувязанных понятий, которые допускали бы их корректный перевод в определения объектов, а затем в алгоритмы и программы, поддерживающие электронный документооборот.

От обычных терминов+

Чтобы не отсылать читателя к первоисточнику, вначале “на пальцах” поясним значение терминов, названных в предыдущей статье.

Лист бумаги с изображенными на нем символами - это лист с данными.

Если эти данные понятны читающему, то они содержат в себе сведения. (Примером может служить ряд слов или предложений на известном читателю языке.)

Сведения, имеющие ссылку на автора, представляют собой авторизованные сведения. Наглядный пример - любой текст, подписанный автором.

Авторизованные сведения, типичные для некоторого множества людей в рамках выделенной каким-либо образом системы, мы называем документом. Для законопослушных граждан, в том числе государственных служащих, документом является текст, направленный в государственную организацию и составленный с учетом требований законодательства. Вне объединяющей граждан надсистемы, а именно государства, его законов и институтов, их обеспечивающих, этот текст - не документ, а простая бумажка.

Для учеников и учителей истории документом служит учебник по истории. Поскольку содержание учебников меняется в зависимости от состояния государства, то понятно, что необходимой характеристикой документа является указание на абсолютное время, а также систему, в рамках которой он действителен.

Для населения РФ рубль - это документ. В свою очередь доллар - документ для жителей и РФ, и США. Оба обеспечиваются национальным достоянием соответствующего государства. Отсюда следует, что состоятельность документа напрямую зависит от состоятельности надсистемы (в данном случае государства), характеристикой и атрибутом которой он является.

Под надсистемой будем понимать систему, не только изначально включающую в себя свои подсистемы, но и объединяющую на дополнительных условиях другие независимые системы или их подсистемы.

Более строго, документом являются любые данные, отвечающие следующим условиям:

- они представлены в какой-либо знаковой системе на конкретном носителе;

- ориентированы на прием определенными классами процессоров (потребителей);

- созданы (указаны авторство, место и время) конкретными процессорами (производителями);

- обладают определенной структурой, позволяющей отнести их к какому-либо типу;

- являются оригиналом либо идентичной оригиналу копией;

- действительны лишь в рамках надсистемы, характеристикой и атрибутом которой они служат.

Данные в документе содержат информацию в том случае, если они:

- восприняты и поняты принимающим процессором (потребителем);

- являются для него новыми;

- являются для него значимыми и актуальными;

- будут использованы для принятия решений в заданном внешними условиями интервале времени.

Предложенные формулировки не дают точных указаний на границы применимости и механизмы реализации документа. Хотя интуитивно подразумевается, что документ бумажный и существует в традиционных, человекоориентированных надсистемах документооборота.

Получив, к примеру, по почте заказное письмо, адресат убеждается в том, что оно доставлено по штатной технологии, адресовано ему, отправитель известен, целостность конверта не нарушена. Затем изучает содержание. При наличии сомнений он может использовать основную (ту же почту) или дублирующие (например, телефон) системы телекоммуникаций. С их помощью можно получить дополнительные уточняющие сведения от отправителя и обслуживающего этапы прохождения документа персонала. После этого принимается решение. Подчеркнем, что адресат может реализовать этот алгоритм лишь в силу того, что заказное письмо как документ существует в рамках соответствующей надсистемы, образованной в государстве обеспечивающими ведомствами.

+к терминам “электронным”

Переходя к “электронным” терминам, заметим, что они требуют отказа от применения умолчаний и более строгого подхода к определениям с учетом их дальнейшей трансформации в алгоритмы.

Электронные данные (как эквивалент чисел, символов и т. д., используемых при ручных манипуляциях) пришлось конкретно и конструктивно определять с появлением ЭВМ и различных систем программирования. К настоящему времени для всех широко распространенных типов аппаратных и программных процессоров базовые типы данных стандартизованы де-факто. Непрерывно ведется работа по стандартизации электронных механизмов поддержки данных разного уровня: типов носителей, способов фиксации данных на носителе и т. д. Данные есть основа системы взаимоувязанных понятий.

Электронными сведениями (ЭС) назовем наборы электронных данных, которые могут быть восприняты и поняты ЭВМ. В настоящее время с развитием средств телекоммуникаций и Интернета границы надсистем, в которых возможен обмен электронными данными и сведениями, настолько расширились, что иногда они принимаются существующими по умолчанию. Но именно в рамках Интернета человечество на собственных ошибках осознает, что сведения - это не документ. И именно в рамках Интернета, в частности под эгидой консорциума W3C, происходит формирование механизмов обеспечения электронного документооборота в сети.

ЭС, позволяющие однозначно идентифицировать их авторство, место и время создания, назовем авторизованными ЭС. В данной статье не поднимается вопрос о способе электронной реализации аналога бумажной рукописи. Однако согласованное в надсистеме подмножество ее свойств (неизменность содержания и формы, подлинность авторского текста, подписи и др.) должно присутствовать и в электронном виде.

Авторизованные ЭС становятся электронными документами (ЭД) только в явно определенных надсистемах обеспечения документооборота, где должны действовать сертифицированные (согласованные и утвержденные в рамках надсистемы) служебные механизмы, выполняющие следующие функции:

- сопровождение описаний применяемых знаковых систем и их кодировок, языков, словарей, справочников, нормативных и регламентирующих документов и т. д.;

- фиксирование авторства и хранение электронных оригиналов электронных рукописей в соответствующей базе (электронный депозитарий);

- преобразование авторизованных ЭС в документы путем приведения языка и структуры к одному из принятых в надсистеме типов. Присвоение документу атрибутов надсистемы. Хранение оригиналов ЭД в соответствующих базах оригиналов документов;

- копирование ЭД и выдача сертифицированных электронных копий системам распространения;

- передача копий (или обеспечение доступа к ним) через сертифицированную телекоммуникационную систему только для конкретных потребителей или оговоренных классов потребителей и регистрация сеансов связи систем распространения с потребителями;

- обеспечение дополнительных коммуникаций систем потребителей и производителей ЭД с упомянутыми выше служебными механизмами надсистемы.

За данными функциями стоят логические механизмы, которые на физическом уровне могут быть реализованы по-разному. Важно то, что в рамках надсистемы каждый служебный механизм должен фиксировать операции, проведенные с ЭД, и при необходимости предоставлять сведения об этом в соответствии с принятыми в надсистеме правилами.

При получении копии ЭД потребитель (ЭВМ) должен установить ее соответствие оригиналу и выполнить при этом следующие действия:

- получить подтверждение, что структуры данных, описывающие реквизиты и другие внешние характеристики копии документа, полностью соответствуют принятым в надсистеме типам;

- проверить реквизиты и другие внешние характеристики (допустимый перечень авторов, соответствие дат и т. д.);

- получить подтверждение, что структуры данных, описывающие содержание копии документа, полностью соответствуют принятым в надсистеме типам;

- осуществить проверку содержания на наличие в нем новых, значимых и актуальных данных;

- проверить при необходимости корректность процедуры получения документа посредством дополнительных обращений к системам служебных механизмов, и принять решение о соответствии полученной копии переданному ЭД;

- зафиксировать при необходимости факт принятия решения с помощью служебных механизмов надсистемы.

Несколько дополнительных замечаний

Вследствие особенностей механизмов поддержки электронных данных они могут обладать не только свойствами, но и методами (при попадании их в соответствующую среду). Соблюдение условия полного соответствия данных принятым в надсистеме типам означает, в частности, отсутствие неопознанных, потенциально активных, опасных фрагментов (например, вирусов).

Представленные выше определения предполагают и рекурсию. Это значит, что надсистема сама может выполнять роль автора или адресата в надсистеме более высокого порядка и т. д.

На этом временно остановимся. Заинтересованному читателю предлагаем сравнить изложенный подход к терминологии с другими, известными ему, и поделиться результатами.

С авторами статьи можно связаться через редакцию PC Week/RE.

Версия для печати