ПЕРВЫЙ ВЗГЛЯД
В августе вышел новый выпуск электронной версии еженедельника PC Week/RE (его появление было приурочено к выставкам SofTool’97 и “Управление’97”). Он по-прежнему умещается на одном компакт-диске, но выполнен в виде трехтомной индексированной базы данных (БД) для специальной Windows-версии информационной системы (ИС) “Кодекс” и содержит электронные копии статей, опубликованных в 1995, 1996 и 1997 гг.*. Благодаря свойству многотомности базы данных (при этом все тома обрабатываются как единый массив) электронный архив обладает неограниченными возможностями обновления за счет дозаписи данных на многосеансовые компакт-диски.
Кому это нужно?
Годовая подшивка печатного варианта еженедельника PC Week/RE (а это 50 номеров, содержащих в общей сложности более трех с половиной тысяч страниц) весит 10 кг и имеет толщину 11 см. Для электронной версии вместе с цветными иллюстрациями к статьям и полнотекстовой информационной системой “Кодекс” (см. PC Week/RE, № 39/96, с. 6) достаточно одного компакт-диска толщиной около миллиметра и массой в несколько граммов. Хранить дома целую подшивку может далеко не каждый. Да что там дома: попробуйте отыскать полное собрание сочинений авторского коллектива PC Week в библиотеке или своем офисе - наверняка нескольких номеров (скорее всего, самых интересных) в ней не хватает.
А теперь представьте, что вам захотелось прочитать все статьи, например, о продукции компании CLR. Перелистывание подшивки едва ли доставит вам удовольствие. Да и со свободным временем, у вас, вероятно, проблемы. А вот выявление этих статей с помощью электронной версии не составит труда. Менее чем за минуту вы получите перечень всех статей, в которых хотя бы один раз упоминается слово CLR. Этот перечень можно отсортировать по дате публикации, по автору, по названию и некоторым другим атрибутам; вы можете сохранить этот список в виде файла, вывести на печать или с его помощью (не отходя от клавиатуры) методично просмотреть все статьи на экране.
Статьи, вызвавшие интерес, могут быть либо распечатаны сразу, либо сохранены в форматах *.txt (DOS- или Windows-вариант), *.RTF или *.KOD (очень экономный внутренний формат ИС “Кодекс”).
Как это работает?
Общие замечания
Первоначально ИС “Кодекс” предназначалась для хранения юридических документов (“Законодательство России”, “Международное право” и т. д.). Хотя у ИС есть эффективные механизмы полнотекстового поиска, каждый документ имеет определенные поисковые атрибуты (вид документа, наименование, дата принятия закона, регистрационный номер и т. д.). В электронной подшивке PC Week/RE каждой статье соответствует несколько иной набор атрибутов: автор, герой, рубрика, номер еженедельника, страница и т. д.
Поиск необходимых статей производится на основании запросов, которые представляют собой набор терминов (они могут быть соединены логическими операторами &, ИЛИ, НЕ), достаточно точно описывающих интересующую вас предметную область. При написании поисковых терминов могут использоваться знаки-заменители: вопросительный знак обозначает любую букву, а звездочка - группу букв произвольной длины. Если аргументом поиска служит некоторое словосочетание, оно должно быть заключено в кавычки. Замечу, что система сама выделяет окончания (поиск терминов осуществляется по их корню), хотя и не всегда делает это достаточно корректно. Так что при формулировке запроса будьте бдительны!
Если заняться просмотром статей, удовлетворивших запросу, то окажется, что поисковые термины выделены специальным шрифтом (он выбирается посредством соответствующих настроек меню “Сервис”).
На практике поиск статей состоит из нескольких этапов. Сначала вы даете общую формулировку запроса, а затем, анализируя найденные статьи, записываете его более точно. Например, если вас интересуют статьи о системных интеграторах, написанные Еленой Монаховой, то первоначальный поисковый запрос может выглядеть так: “Монахова & интеграторы” (по умолчанию между словами запроса вставляется логический оператор ИЛИ). Если же вас интересуют статьи на эту тему других авторов, то запрос принимает форму: “интеграторы % Монахова” (в ИС “Кодекс” знак % обозначает логический оператор НЕ). Заметим попутно, что в запросе может указываться допустимое число слов в тексте между поисковыми словами. Если их, например, пять, то термины разделяются ключом /5 (в том случае, когда порядок слов неважен) или -5 (если важен).
В документах, удовлетворивших ваше поисковое условие, все слова, заданные в поисковом запросе, будут выделены, что, согласитесь, очень удобно при просмотре.
Находясь в информационном окне типа “Список”, вы можете отсортировать полученный перечень статей по значению любого атрибута, отфильтровать по некоторому дополнительному условию, скопировать часть списка в буфер.
Список документов, удовлетворяющих запросу, командой “Сортировка” (выбирается с помощью пиктограммы или “горячей” клавиши F5) можно упорядочить по любому из атрибутов.
С помощью фильтра (“горячая” клавиша F6) на список накладываются дополнительные условия. Списки документов можно объединять, находить их пересечение и даже “разность”. Xранить cписки можно в пользовательских папках. Самые интересные фрагменты документов можно отмечать, чтобы затем к ним вернуться.
Приблизительный поиск
Приблизительный поиск используется в том случае, если вы не очень хорошо владеете предметной областью.
В режиме приблизительного поиска система выстраивает список найденных статей по степени их близости к требованиям запроса (путем присвоения веса от 1 до 100). При этом значение статьи зависит как от числа найденных в ней терминов, так и от места их расположения: термин, обнаруженный в заголовке, ценится выше. Честно говоря, механизм назначения веса является достаточно сложным: задав в качестве поискового термина собственную фамилию, я получил несколько десятков статей с самым различным весом - от 32 до 100. Естественно, что в каждой статье фамилия автора упоминалась только один раз, а связи между размером статьи и ее весом я не обнаружил.
Полнотекстовый поиск
Полнотекстовый (универсальный) поиск может активизироваться через основное меню (подраздел “Новый поиск”) посредством выбора специальной пиктограммы на панели инструментов или путем нажатия клавиш Alt+S. При этом поисковые термины можно копировать из найденных статей (с помощью элемента меню из раздела “Редактирование”) и вставлять (с помощью правой кнопки мыши) в соответствующие окна диалогового меню. Если эту процедуру проделывать достаточно часто, то порядок действий в конце концов запоминается и выполняется на подсознательном уровне. Хотя пользователям было бы проще, если бы существовала клавиша, позволяющая запустить механизм полнотекстового поиска сразу после выделения фрагмента из исходной статьи.
Проблемный поиск
Кроме полнотекстового поиска (с использованием булевых операторов И, ИЛИ, НЕ) в БД можно осуществлять последовательный просмотр номеров еженедельника, отдельных его рубрик, статей определенных авторов и так далее.
В качестве поисковых терминов не рекомендуется использовать так называемые “шумовые слова” (более, была, ваш, вдруг, вместо, всякий, данные, для, затем, иногда, каждый, когда, либо, между, настоящее, некоторые, несколько, таких, только, этим, якобы и т. д.). В системе имеется список “шумовых слов”, и при попытке включения их в поисковую формулу выдается предупреждающее сообщение.
Маленькие хитрости
Возможности ИС “Кодекс” не менее разнообразны, чем возможности MS Word. Но далеко не все они очевидны, на многие из них “натыкаешься” лишь в процессе практического общения. Система имеет разветвленную справочную систему, но у меня создалось ощущение, что она временами запаздывает за развитием ИС, а иногда бежит впереди.
Поэтому, пользуясь случаем, хочу дать несколько советов. Первое, с чем может столкнуться пользователь: установленные в ОС шрифты не позволяют обратиться к системе помощи и даже прочесть наименования основных разделов меню! Выход состоит в том, чтобы запустить “Кодекс” вручную с ключом /fonts, а затем установить нужные шрифты (для оформления основного, справочного, а также диалоговых и информационных окон ИС “Кодекс” может использоваться до 10 различных шрифтов). Результаты такой установки видны сразу. Не забудьте только их сохранить, чтобы потом не начинать все сначала.
Второе: при инсталляции БД одним из самых неочевидных этапов является подключение баз данных. Для его выполнения необходимо из меню “Сервис” выбрать подраздел “Установка БД” и с помощью кнопки “Подключить” - дисковод компакт-диска (обычно это устройство D), а затем указать имена файлов, содержащих тома БД PC Week/RE.
Работа над тематической частью электронной подшивки PC Week/RE пока не завершена**. Вполне вероятно, что в нее в полном объеме войдет внутриредакционный “Толковый англо-русский словарь компьютерных терминов”, используемый нашими переводчиками, научными и литературными редакторами (наиболее распространенные термины из этого словаря публиковались в PC Magazine/RE).
Несмотря на отдельные недостатки, можно считать, что электронная версия PC Week/RE - отличный подарок всем любознательным специалистам, которые ценят свое время. Я, например, прежде чем отправиться на пресс-конференцию, за интервью или начать писать статью, стараюсь (насколько позволяет время) просмотреть все, что относится к предмету разговора. Теперь же это можно сделать полнее и быстрее.
Требования к аппаратным и программным ресурсам
ИС “Кодекс” создана петербургским “Центром компьютерных разработок”. Минимальная конфигурация компьютера: процессор i80386SX и выше, ОЗУ не менее 4 Мб, дисковод компакт-диска (хранить большие базы данных на винчестере весьма накладно), дисплей, мышь, клавиатура, ОС Windows 3.1 и выше. Рекомендуемая конфигурация компьютера: i486DX2-66, 8 Мб ОЗУ, 640 Мб жесткий диск. Дистрибутив ИС “Кодекс” версии 4.2x занимает чуть больше 2 Мб, после установки на жестком диске - 4,2 Мб, из них 0,5 Мб приходится на достаточно подробную справочную систему.
Инсталляция системы состоит в установке на жесткий диск ИС “Кодекс” и привязки к ней находящихся на компакт-диске БД. После инсталляции ИС “Кодекс” занимает на жестком диске около 4 Мб.
Она может работать:
- на локальных ПК и в локальных сетях (версия 4.2х для Windows 3.1, Windows 95 и Windows NT);
- в интрасетях (версия “Кодекс-intranet/Internet”).
С 1 сентября трехтомная электронная версия PC Week/RE распространяется через сеть представителей, занимающихся распространением ИС “Кодекс”. Стоимость поставки - $120, стоимость ежемесячного обновления - $30.
В комплект поставки входят: коробка, 164-страничное руководство пользователя, регистрационные карты, лицензионное соглашение, гарантийный талон и CD-ROM, на котором находятся программный комплекс и три информационных раздела общим объемом около 250 Мб. Приобрести его можно в ЗАО “Термика-плюс” (телефон: 095/233-5727, электронный адрес: ask@termika.ru).
Кроме того, с электронной версией PC Week/RE можно будет познакомиться на выставках SofTool’97 (стенд D34) и “Управление-97” (стенд 1002)
Электронная подшивка PC Week/RE за 1996 г. доступна по адресам: www.pcweek.ru, www.termika.ru, www.kodeks.net. 4
* Изготовителями электронной версии PC Week/RE являются ЗАО “СК ПРЕСС” (редакция PC Week) и ЗАО “Термика-плюс”. Изготовителем программных комплексов ИС “Кодекс” является петербургский Центр компьютерных разработок.
** ЗАО “Термика-плюс” уже ведет работу над электронной версией “Англо-русского словаря терминов и сокращений по ВТ, связи и программированию” (авторы Э. М. Пройдаков, Л. А. Теплицкий).
Владимир Митин