Джим Рапоза (PC Week Labs)

Системы поиска

Фильтрация, алгоритмы аналитической  обработки  -  актуально ли это для поиска связей с Web-узлами?

Перспективная программа молодой фирмы из Сан-Франциско помогает пользователям Web находить нужную информацию благодаря применению технологии коллективной фильтрации во всей сети.

ПО Alexa фирмы Alexa Internet предоставляет список Web-узлов, связанных с тем, который в данный момент просматривается. По мнению сотрудников Тестового центра PC Week Labs, это очень простое и удобное средство, позволяющее видеть основную информацию: владельца Web-узла, популярность (по числу посетителей узла) и новизну (по частоте обновления информации). Мы могли проголосовать о полезности предлагаемого узла.

Alexa предоставляет информацию о Web-узлах

и связи с близкими по содержанию узлам

    

В некоторых случаях Alexa приводила нас к очень ценным узлам, о существовании которых мы и не догадывались. Однако в других случаях те узлы, которые она определила как полезные, в действительности имели очень косвенное отношение или не представляли для нас ценности. Базовая информация об узле, которую предоставляет бета-версия программы Alexa, также требует некоторой доработки.

Фирма-разработчик предполагает получать доход за счет продажи рекламных объявлений, появляющихся на панели инструментов. Alexa работает с браузерами корпораций Microsoft и Netscape Communications в средах Windows 95 и Windows NT.

Осваивая просторы киберпространства

Для получения специально отобранной информации Alexa применяет технологию коллективной фильтрации и алгоритмы аналитической обработки к маршрутам просмотра узлов.

Технология коллективной фильтрации обычно применяется на специализированных узлах электронной торговли, таких, как Amason.com, и основана на том предположении, что пользователям со сходными интересами будут нравиться одни и те же вещи. Так, например, если пользователю понравился какой-то роман Стивена Кинга, то Web-узел может порекомендовать ему книгу Клива Баркера, которая пришлась по душе другим почитателям Кинга.

Технология коллективной фильтрации используется в продуктах фирмы Firefly Network, а также другими разработчиками ПО для коммерческих узлов с целью упрощения организации персонализированного взаимодействия с посетителями.

Alexa  -  одна из первых фирм, которые пытаются распространить эту технологию на всю Web. Поскольку бета-версия Alexa появилась недавно и не получила широкого признания, то в настоящее время список связей конкретного узла с относящимися к нему узлами составляется путем прослеживания маршрутов пользователей после того, как они покинут данный узел.

Alexa позволяла нам принимать решение о ценности предложенного узла, однако остается неясным, учитывала ли Alexa нашу оценку при формировании списка связанных узлов. В дальнейшем, как заявили представители фирмы, программа при определении связей будет частично руководствоваться оценками пользователей.

Как показало тестирование, создание связей на основе анализа маршрутов пользователей дает как положительные, так и обескураживающие результаты. Во время просмотра узла PC Week, мы обнаружили, что в предложенном списке близких связей помимо действительно представляющих интерес, были также узлы, имеющие к нам, мягко говоря, очень далекое отношение (узел National Computer Tectonics, например). Однако в других тестах мы получали более согласованные списки связей для тестируемого узла.

Представители фирмы Alexa объяснили такие отклонения в результатах небольшим числом участников бета-тестирования и выразили уверенность в том, что результаты будут более точными после запуска и широкого распространения программы, когда можно будет анализировать маршруты Web-путешествий для большого числа пользователей.

Пользователи могут включать узлы в список родственных связей Web-страницы. Alexa ведет учет добавляемых пользователями связей   и учитывает их в уравнении оценки при формировании списка родственных узлов для других пользователей.

Многие функциональные возможности программы Alexa основаны на мониторинге маршрутов просмотра, что может вызвать опасения по поводу возможных нарушений личных прав пользователей. Однако представители фирмы заверили, что вся информация регистрируется анонимно, поэтому их программа не позволяет установить, что делают конкретные пользователи.

Что касается предоставления базовой информации о просматриваемом нами узле, то здесь следует отметить некоторую недоработку программы Alexa. Так, например, пять звездочек должны бы означать наивысшее качество содержания узла. Однако мы обнаружили, что звездочки всего лишь соответствуют числу посетителей узла и никак не относятся к его качеству. Пять звездочек получают 10% наиболее часто посещаемых узлов. Узлы с меньшим числом посетителей получают меньше звездочек.

Представители фирмы Alexa сообщили, что отдельный показатель качества, основанный на присваиваемой пользователями оценке, будет введен позднее в следующие версии программы.

Информация о скорости сервера и новизне содержания, как показали тесты, оказалась очень субъективной и не слишком полезной. Скорость сервера, например, программа оценивает по тому времени, которое затрачивается на пересылку затребованных страниц в офис Alexa, находящийся в Сан-Франциско. Хотя эта информация и может представлять интерес для сотрудников самой фирмы, но является практически бесполезной для пользователей, особенно находящихся в другом конце США или других странах.

При такой оценке скорости и новизны содержания собственный узел фирмы Alexa выглядит внушительнее, чем такие гиганты, как узел корпорации Netscape Communications или узел фирмы Yahoo. В наших тестах скорость этих узлов получила оценку Average (средняя), тогда как узел Alexa был отнесен к Fast (быстрый).

Новизна узлов определяется по “среднему возрасту” его страниц: “свежими” считаются узлы, у которых средний возраст страниц менее шести месяцев, “старыми”  -  у которых средний возраст более двух лет, а все остальные относятся к “среднему возрасту”.

Это приводило к очень противоречивым оценкам в наших тестах  -  узлы, страницы которых каждый день многократно обновлялись, идентифицировались программой как имеющие средний возраст, поскольку у этих узлов были очень хорошие (и, разумеется, старые) архивы, тогда как недавно появившиеся, но не обновлявшиеся в течение нескольких месяцев, были определены как свежие. На наш взгляд, было бы полезнее просто ввести две категории узлов: свежие (обновленные не позднее шести месяцев назад) и устаревшие.

Если разработчики Alexa смогут улучшить качество информации об узле, то было бы полезно такую же информацию добавить и к рекомендуемым связям. Это дало бы возможность пользователям узнать рейтинг и оценку новизны содержания узла до фактического обращения к нему.

Alexa включает интерфейс дискуссий (chat), позволяющий переговариваться в реальном времени с другими пользователями этого ПО. Нам понравилось, что “виртуальный собеседник” должен знать адрес другого пользователя, чтобы связаться с ним. Это избавит вас от нежелательных контактов.

В тестированной нами бета-версии средство архивации еще не функционировало в полном объеме, но в законченном виде оно позволит обращаться к онлайновому архиву, поддерживаемому программой Alexa, в котором содержатся временно отсутствующие или удаленные страницы.               

Резюме для руководителей

Как бесплатное дополнение к браузерам пользователей, Alexa является хорошим подспорьем в поиске узлов, которые, по мнению других пользователей, являются полезными или интересными. Однако необходимо улучшить интерфейс и механизм сбора базовой информации об узле, прежде чем она получит широкое распространение.Методология оценки: www.pcweek.com/reviews/meth.html.

Alexa 1.0.Alexa Internet, Сан-Франциско, шт. Калифорния;  (415) 561-6900, www.alexa.com.

Помогает пользователям находить родственные узлы, имеющие отношение к просматриваемому.

Предоставляемая программой информация об узлах иногда вводит в заблуждение. Родственные связи не всегда оказываются таковыми.

Версия для печати