РЕЦЕНЗИИ
Наталья Карасева, Андрей Алексеев
Я один живу и работаю в семи комнатах, - ответил
Филипп Филиппович, - и желал бы иметь восьмую.
Она мне необходима под библиотеку.
Михаил Булгаков. Собачье сердце
Специалистам в любых отраслях наук, ремесел, искусств и т. д. рано или поздно приходится так организовать свою жизнь и занятия, чтобы, говоря научно, исключить интерференцию. Но если можно спорить о том, отводить ли отдельную комнату под столовую, под операционную, смотровую, то при обсуждении неуклонно растущих объемов библиотек счет, пожалуй, придется вести на этажи.
Исследования и проекты в области создания электронных библиотек (ЭБ), по-видимому, в состоянии снять эту проблему. Практические достижения здесь уже настолько убедительны, что начинаешь верить: от квартирных проблем с выделением особой площади под библиотеку читатели любой специальности будут избавлены уже совсем скоро.
Армс Вильям. Электронные библиотеки. Пер. с англ. М., ВИНИТИ, 2001. - 276 с.
В предисловии сообщается, что предлагаемая книга открывает целую серию под названием “Цифровые библиотеки и электронные издательства”, выпускаемую Массачусетским технологическим институтом (MIT Press) и посвященную теме ЭБ (электронных, или цифровых, библиотек). Хотя книга и уделяет внимание технологическим аспектам, она отнюдь не является справочным пособием по организации и поиску данных. В равной мере она затрагивает социально-экономические и организационные обстоятельства, стимулирующие или, наоборот, тормозящие совершенствование библиотек и издательств. Эта тема особенно актуальна именно теперь, когда стало возможным построение широкомасштабного сервиса на основе печатных, аудио- и видеоколлекций, которые хранятся в цифровой форме и доступ к которым осуществляется по сети.
Технологии приходят и уходят, люди не меняются
Как релятивистски замечает автор, люди не меняются с появлением новой технологии. Создаваемую ими информацию по-прежнему нужно соответствующим образом организовывать, хранить и распространять. Они по-прежнему ищут книги, документы, ноты и аудиозаписи, картины и видеофильмы, уже созданные где-то и кем-то, желая использовать их для обучения, развлечения или иных целей. Однако технология оказывает очень большое влияние на то, как информация хранится и управляется. Возрастает разнообразие и число коллекций, доступных в цифровом виде, постоянно улучшается технологическая база. Накапливаясь, эти перемены способствуют заметным качественным изменениям в процессах создания и использования информационных хранилищ.
С течением времени образовалась самостоятельная дисциплина, в рамках которой сотрудничают самые разные специалисты: экономисты, социологи, физики, медики, юристы+ И в последние десятилетия конечно же - представители компьютерных специальностей.
В первой главе книги даются хотя и простые, но важные терминологические объяснения. Вот, например, как вводится информационное определение ЭБ: “Это управляемая коллекция информации в совокупности с соответствующими сервисами, причем информация хранится в цифровых форматах и доступна по сети. Ключевой частью этого определения является слово “управляемая”. Поток данных, передаваемый со спутника на Землю, - еще не библиотека. Те же самые данные, организованные в определенную систему, становятся коллекцией ЭБ. Большинство людей не согласятся рассматривать базу данных финансовых записей отдельной компании в качестве ЭБ, однако совокупность такой информации по множеству компаний уже является разделом библиотеки”.
Поскольку участники процесса развития электронных библиотек пришли из разных областей и принесли с собой специфические термины, уточнение этих терминов обязательно. Оказывается, такие слова, как “публиковать”, “документ”, “копия”, “объект”, “работа” настолько многозначны, что автор даже предлагает запретить их употребление в дискуссиях, не сопроводив подробным толкованием в русле контекста (как полезна была бы аналогичная мера и в других областях!).
История электронных библиотек и стимулы их развития
Несколько следующих глав содержат ретроспективу развития технической базы ЭБ и ряд хотя и элементарных, но емких обсуждений экономических стимулов развития отрасли. Они (обсуждения) выгодно отличаются от птичьего языка квазиэкономической зауми, на котором чаще всего вещают знатоки маркетологии и рыночной экономики.
Мало кто из нас об этом задумывался, но библиотеки традиционно быстро воспринимают новые технологии, включая микрофильмы, онлайновые информационные сервисы и компакт-диски. Среди прочего в книге Армса есть такой пример: второй пишущей машинкой, импортированной в Бразилию, стала машинка, предназначавшаяся для печати каталожных карточек в Национальной библиотеке. Последние примеры того, как библиотеки адаптируют новое, - это Интернет и веб.
Однако оказывается, отмечает автор, что широко распространяющиеся современные коммерческие программные продукты не всегда отвечают библиотечным нуждам. Компьютерная индустрия ориентирует свои продукты на большие рынки - бизнес, науку, офисную деятельность, медицину, игры, военное дело. В США большая часть базовых исследований, на которых основываются такие продукты, финансировалась Министерством обороны или мощными компаниями уровня IBM. До недавнего времени эти гиганты не проявляли особого интереса к проблемам управления отдельными фрагментами информации (как в ЭБ) и, как следствие, их проекты не учитывали задач больших библиотек. Последние были вынуждены заимствовать и адаптировать под свои нужды технологии из других областей.
Еще до появления современных компьютерных сетей крупными книгохранилищами было разработано много способов разделения ресурсов, включая межбиблиотечный абонемент, взаимные привилегии по доступу (reciprocal reading privileges), обмен фотокопиями. Предоставляемые, например, Британской библиотекой сервисы, такие, как фотокопирование или доставка документов, улучшали доступ к информации для пользователей всего мира.
Практически каждая библиотека ведет каталог с записями о материалах своих коллекций. В области каталогизации библиотечные работники употребляют точную терминологию. Так, специалист по библиотечному делу может использовать слово “каталог” только в следующем значении: коллекция библиографических записей, созданная по строго определенным правилам. Привычную всем “книгу” библиотекари называют “монографией”. Многие годы информация, включаемая в монографическую каталожную запись, кодифицировалась согласно определенным правилам ведения каталогов. Англоязычные страны пользуются Англо-американскими правилами каталогизации (AACR).
Книга так последовательно написана и хорошо переведена, что нам показалось уместным попытаться передать потенциальным читателям ее информативность и стиль, столь же последовательно пройдя по ее содержанию. Так что пойдем дальше.
Библиотеки обмениваются каталожными записями, стремясь снизить расходы. Крупные учреждения, самостоятельно каталогизирующие большое количество печатных изданий, такие, как Библиотека Конгресса США или университетские библиотеки, предоставляют свои каталожные записи бесплатно. Поэтому, чтобы избежать дублирования, большинство библиотек ищет уже существующие каталожные записи и создает свои собственные только тогда, когда поиски безуспешны.
Каталоги и протоколы
С конца 1960-х годов обмен каталожными записями был компьютеризирован. Фундаментальным инструментом для представления и реализации данного процесса в компьютере стал формат MARC (MAchine-Readable Cataloging). Он был разработан в Библиотеке Конгресса США для распространения каталожных записей на магнитной ленте. Каталогизация на базе протокола MARC распространилась не только на монографии. В настоящее время этот протокол используется для большинства категорий библиотечных материалов, включая продолжающиеся издания, архивы и неопубликованные статьи (manuscripts).
Развитие системы MARC привело к появлению важных типов компьютеризированных систем. Доступность записей в данном формате послужила толчком к следующей разработке. Отдельные библиотеки начали создавать свои онлайновые каталоги.
Сегодня практически любая библиотека США имеет свой онлайновый каталог. На библиотечном жаргоне такие каталоги называются “онлайновый каталог публичного доступа” (online public access catalog, OPAC). Многие библиотеки приложили большие усилия по переводу всех старых бумажных каталогов в формат MARC, что позволяет избежать ситуации, когда новые поступления находятся в онлайновом каталоге, а более старые издания - в обычном. Иногда автор приводит стоимостные характеристики обсуждаемых процедур. Скажем, когда недавно Гарвардский университет осуществил перевод старого бумажного каталога в машинную форму, то создание 5 млн. записей обошлось ему примерно в 15 млн. долл.
MARC был передовым форматом в то время, когда большинство компьютерных систем представляли текстовые поля только фиксированной длины с заглавными буквами. Этот период остался в прошлом, но пока принятие новой версии формата MARC осложняется ввиду того, что во внедрение старого сделаны огромные инвестиции.
Разделение каталожных ресурсов было первым примером масштабного совместного использования информации с помощью Интернета. В конце 70-х годов некоторые библиотеки и исследовательские организации, такие, как Библиотека Конгресса, Исследовательская группа по библиотекам (Research Libraries Group), Информационная сеть библиотек Вашингтона (Washington Libraries Information Network), начали реализацию проекта, известного под названием Linked Systems Project. Разработанный в его рамках протокол Z39.50 позволяет компьютеру искать информацию в каталоге, размещенном на другой машине. Первоначально Z39.50 использовался для поиска записей в MARC, однако оказался достаточно гибок, чтобы не ограничиваться только этим форматом, и теперь широко используется для достижения интероперабельности между различными системами.
Абстрактные модели и метаданные
Главы с двенадцатой по четырнадцатую, завершающие книгу, содержат материал, заслуживающий особенно внимательного изучения. Обсуждаются такие понятия, как абстрактные модели библиотечных объектов, идентификаторы и структурные метаданные, обобщаются и разъясняются понятия произведения, представления, публикации, экземпляра (works, expressions, manifestations, items).
Пользователи ЭБ обычно предпочитают обращаться к объектам более абстрактным, нежели файлы. Обычные слова - отчет, компьютерная программа, музыкальное произведение - часто относятся ко многим цифровым объектам, которые следует рассматривать вместе. Причем они могут различаться по формату, по содержанию, по условиям доступа.
Требуется концептуальная модель, которая позволила бы описывать содержание на разных уровнях абстрагирования.
Большинство ранних разработок в области ЭБ было связано с материалами, имевшими прямой аналог в виде физического объекта. Обычно их можно представить как компьютерный файл простой структуры. Но возможности ЭБ значительно шире - они включают все, что может быть представлено в цифровом формате. Эта среда позволила работать с новыми объектами, такими, как программное обеспечение, моделирование, анимация, видео, слайд-шоу, аудио, а также предоставила новые способы структурирования материалов. Вычислительная техника привнесла свои собственные типы объектов - электронные таблицы, базы данных, символьную математику, гипертекст.
Средства, обеспечивающие управление такой сложной средой, можно условно разделить на несколько категорий: идентификаторы для цифровых объектов; типы данных, специфицирующие, поясняющие то, что представляют эти данные; структурные метаданные, которые отражают связь между цифровым объектом и его составными частями. Суммарно они создают “модель объекта” (object model), описание некоторой категории информации, что и позволяет компьютерным системам обеспечивать доступ к сложно, но по хорошо определенным правилам, организованным данным. Необходимо учитывать и то обстоятельство, что информация, хранящаяся в нынешних ЭБ, прослужит еще, видимо, многие годы, а компьютерные системы за это время эволюционируют до такой степени, которую даже трудно себе представить. Как следствие, интероперабельность и долгосрочная согласованность (persistence) будут всегда в центре внимания исследований в этой области.
Остается только сказать, что это издание рекомендовано Учебно-методическим объединением вузов РФ в области прикладной информатики в качестве учебного пособия, предназначенного для обучения в высших учебных заведениях по курсам “Информатика” и “Информационные системы”. Мы даже обнаружили, что это предназначение уже реализовано на сервере одного из крупных учебных заведений, в программах которого библиотечное дело и смежные дисциплины занимают ведущие позиции (www.rsuh.ru/dl/zaglavlnaya.htm). Хотя материал книги основан практически полностью на американском опыте развития ЭБ, заглянув на сайты и порталы наших ведущих библиотек федерального уровня и ряда вузов, нетрудно убедиться, что отечественное “электронно-каталоговедение” - по крайней мере в идейном плане - подтверждает тезис автора о быстрой адаптации к новым технологиям работников этой сферы.