WEB-РЕСУРСЫ

Компания Rambler продолжает расширять линейку поисковых средств, предназначенных для разработчиков ПО и других ИТ-специалистов. Несколько месяцев назад в рамках программы "Rambler - разработчикам" был реализован поиск по архивам FreeBSD и Linux. Теперь появилась возможность работы с содержимым онлайнового ресурса Microsoft Developer Network (MSDN, http://msdn.microsoft.com) - официального Web-портала Microsoft c информацией обо всех инструментах, языках программирования, программных интерфейсах и функциях, поддерживаемых средствами разработки корпорации. Этот регулярно пополняемый архив насчитывает почти 725 тыс. HTML-страниц, более 500 тыс. оригинальных документов и свыше 1400 рубрик.

Ссылки на документы, найденные в MSDN, выделяются в отдельную ссылку, которая помещается в начало страницы с результатами поиска

Портал имеет собственные встроенные средства поиска, но, как это ни странно, встроенная поисковая машина MSDN почему-то не отличается оперативностью обновления (порой задержка составляет несколько недель) и качеством оценки релевантности найденных документов. Так родилась идея создать простой и удобный профессиональный поиск по MSDN Library - ведь он был необходим и самому Rambler для решения собственных задач. Большинство разработчиков компании занималось созданием программ под Microsoft Windows; они сами часто пользуются этим ресурсом и давно понимают необходимость повышения качества поиска. Однако это стало возможно совсем недавно, когда появилась новая версия поисковой машины Rambler, позволяющая автоматически привязывать найденную информацию к дереву рубрик.

Тематический рубрикатор MSDN Library был восстановлен из Web-страниц, которые робот Rambler скачал с сайта библиотеки. Специальный модуль в автоматическом режиме следит за тем, чтобы восстановленное дерево рубрик соответствовало оригинальной структуре информации MSDN. Рубрикатор заметно упрощает поиск по библиотеке, позволяя выбрать среди множества найденных документов те, которые непосредственно относятся к интересующей пользователя технологии. Кроме того, все результаты поиска сопровождаются цитатами, содержащими слова запроса. Цитаты помогают определить наиболее релевантную запросу страницу библиотеки. Рубрикатор и механизм цитирования бывают особенно полезны в случаях, когда пользователь знает, что делает искомая функция, но не знает, как она называется. Поисковый индекс MSDN Library наcчитывает около 100 тыс. ключевых слов.

Как и большинство специализированных поисковых сервисов Rambler, поиск по MSDN Library интегрирован с основной поисковой машиной. В общем случае поиск ведется по всем Интернет-ресурсам, но документы, найденные в MSDN, выделяются в отдельную ссылку, которая помещается в начало страницы с результатами поиска. При этом пользователи могут ограничиться одним лишь поиском в рамках MSDN на главной странице данного сервиса - http://msdn.rambler.ru.

В настоящее время специалисты Rambler заканчивают подключение к специальному поисковому ресурсу базы данных русскоязычной MSDN Library (www.microsoft.com/rus/msdn), которая содержит почти 45 тыс. страниц. В результате с учетом расширения англоязычного ресурса общий объем базы данных MSDN приблизится к 1 млн. страниц.