СТАТИСТИКА

Как множество анонимных бесплотных теней, которые заглянули к вам на сайт и снова растворились во Всемирной паутине, превратить в портреты реальных посетителей? Роль волшебной палочки в этой непростой задаче берет на себя Интернет-статистика. Именно она должна дать ответы на все интересующие вас вопросы: кто к вам пришел, откуда и как попал на ваш сайт, что, сколько времени и на каких страницах делал, каким программным обеспечением пользовался, когда и куда ушел. Изучение аудитории - это не просто праздное любопытство, это первостепенная задача при планировании и развитии любого бизнеса. Уже потом на столь мощном фундаменте вы сможете что-то изменить в лучшую сторону - повысить качество сайта, сформировать целевой рынок, найти индивидуальный подход к каждому потенциальному клиенту и в идеале предоставить ему именно то, в чем он нуждается.

Если не вдаваться в многочисленные технические детали, то в основе любого частного статистического анализа, проводимого в сети, лежат две возможности сбора информации. Речь идет о так называемых счетчиках и лог-анализаторах. Рассмотрим поподробнее, что они из себя представляют.

Счетчики

Бытует мнение, что счетчики являются основным инструментом статистики для широкого круга пользователей, тогда как лог-анализаторы находят применение у более квалифицированных веб-мастеров. Это простое народное заключение связано с тем, что в Сети буквально на каждом углу вам предлагаются услуги внешних счетчиков. Во всяком случае ряд известных порталов Рунета практикует такое в массовом порядке. Подобные услуги могут предоставляться бесплатно и быть сопряженными с системой действующих рейтингов сайтов (RamblerTOP100, TopMail) или на коммерческой основе (SpyLog, HotLog). Все внешние счетчики выглядят как небольшие картинки с логотипом соответствующего портала статуслуг (и, возможно, циферками о количестве посетителей), которые загружаются каждый раз вместе с загрузкой вашей странички у пользователя. Конечно, просто информации, передаваемой на сервер при загрузке изображения, недостаточно. В ход идут специальные программы на JavaScript и файлы, сохраняющиеся на компьютере пользователя при первой загрузке вашего сайта.

Какую информацию способен собрать счетчик? Честно скажем, что немаленькую. Во-первых, он определит, кто приходил на сайт. Нет, конечно, информация не будет выглядеть вроде: в 22.00 на ваш сайт заглянул Вася Петин из Нижнепупенска, но по крайней мере вы будете располагать IP-адресами посетителей. В качестве бонуса вы узнаете, какой версией браузера они воспользовались, какая операционная система стоит у каждого из них на компьютере и даже какое разрешение экрана у их монитора (последнее, впрочем, заинтересует в лучшем случае дизайнеров). Далее счетчик определит, откуда заглянул посетитель, сколько времени он пробыл на сайте и на отдельных его страницах и как по ним перемещался. Из собранных данных (за неделю, месяц, год) машины серверов, предоставивших вам счетчик, сгенерируют отчеты о динамике, изучив которые вы сделаете соответствующие выводы.

Принцип подсчета веб-сатистики в целом незамысловат, зато чрезвычайно трудоемок. Однако большинство современных статистических серверов худо-бедно справляется с терабайтами собранных данных, и на выходе вы имеете до 30 отчетов, часто в цвете, в виде диаграмм и графиков. Это далеко не просто усредненная частота посещения вашего сайта: основные отчеты содержат массу интересных и полезных для всякого пользователя данных. К примеру, вы получите отчет о количестве уникальных посетителей, отчет об основных реферерах (URL-адресах, с которых посетитель пришел к вам на сайт, в том числе и данные о том, кто из них нашел вас через поисковые машины), отчет о сессиях - путях посетителя по сайту за время посещения и отчет о постоянных посетителях, составляющих ядро аудитории вашего сайта. Бесценная кладезь информации. Пользуйтесь на здоровье!

Погрешности

Только вот незадача: пользоваться одной лишь информацией внешнего счетчика при планировании серьезного бизнеса можно исключительно на свой страх и риск. Почему? Потому что ни один из существующих на данный момент счетчиков не может предоставить вам точной статистики в силу ряда вполне объективных причин. Попробуем разобрать погрешности работы счетчиков, из-за которых их вычисления становятся весьма и весьма приблизительными.

Во-первых, счетчики, использующие запрос к графическому элементу, не считают пользователей с отключенной в браузере графикой. Во-вторых, счетчики, использующие JavaScript, не считают посетителей, отключивших у себя Java-поддержку. В-третьих, идентификация пользователей по IP-адресу/хосту не является достоверной, так как велика вероятность того, что из нескольких компьютеров, функционирующих через один прокси-сервер, например на рабочем месте или в Интернет-кафе, к вам заглянули разные посетители или, напротив, разные адреса получил от провайдера один владелец модема.

Наконец, в-четвертых, пятых и двадцатых, существуют многочисленные проблемы, связанные с работой (нередко с перебоями), задачами (такими, как минимизация накруток при составлении рейтинга) и ограничениями (все прочие технические и личные неудачи) сервера, обслуживающего счетчики. А помимо этого проблемы из-за того, что вы используете разные браузеры, а счетчики - специальные, шпионские по своей сути файлы (cookies). Наглядно все "недосчеты" можно продемонстрировать, сравнив показания разных счетчиков, установленных на одном веб-ресурсе за определенный промежуток времени: разброс иногда более чем значителен - показатели могут различаться в 2-3 раза.

А неправильное знание, знаете ли, хуже, чем незнание. Может, именно поэтому профессионалы отдают свою руку, сердце и доверие лог-анализаторам?

Лог-анализаторы

Начнем с того, что у каждого веб-сервера есть файловый журнал, содержащий записи обо всех посетителях. Здесь вы найдете IP-адрес или название хоста, дату, собственно текст запроса, код ошибки, реферер (ссылающуюся страницу), сведения о трафике и идентификаторе браузера. К сожалению, у счетчика нет доступа к этому файлу, однако все накопленные в нем данные могут быть изучены специальными программами - лог-анализаторами.

Простейший анализатор журнала вы можете написать и сами, однако ваша примитивная программа никогда не сможет соперничать со специально разработанными для этой цели "западными" анализаторами - WebTrends и Advanced Log Analyzer или, к примеру, Log Analyzer от компании NetPromoter.

В отличие от счетчиков эти программы способны более прицельно, вплоть до мелких деталей, собрать всю основную информацию по посетителям и построить для вас развернутые, гибкие и по необходимости нестандартные отчеты. Лог-анализаторы сделают для вас доступной такую информацию, как визиты многочисленных поисковых роботов, загрузка всевозможных файлов (мультимедиа или картинок) и, например, хакерские атаки.

При этом статистика не будет больше зависеть от пропускной способности канала и загруженности чужого сервера. Таким образом, отчеты лог-анализаторов будут отличаться, с одной стороны, большей достоверностью (не теряется информация, если внешний сервер перегружен или файлы счетчика недогрузились), с другой - большим разнообразием и полезной детализацией (добавляется ряд отчетов: подсчет показанных и "нажатых" баннеров, детализация трафика, географического разброса посетителей и крайне важный при оценке индексации вашего сайта в поисковых системах отчет о посетивших вас поисковых роботах).

К сожалению, при всех этих далеко не скромных способностях есть и у лог-анализаторов ахиллесова пята: они очень плохо разбираются в ситуациях, когда разные пользователи заходят с одного IP-адреса или один с разных. Кроме того, если у пользователя несколько браузеров, он будет прописываться в логе как несколько отдельных посетителей. Правда, эти проблемы частично снимаются с помощью cookies-файлов, которые счетчик может сбросить на ПК посетителя для отслеживания, например, повторных посещений вашего сайта. Именно поэтому (а еще, пожалуй, потому, что хороший многофункциональный лог-анализатор стоит крайне недешево) истинные профессионалы при составлении отчетов по статистике собирают информацию всеми доступными способами. То есть рассматривают счетчики и лог-анализаторы не как конкурентные, а как дополняющие друг друга продукты современных компьютерных технологий.

Однако на практике обработать и сопоставить то, что насчитал счетчик (особенно если он внешний и уж тем более не один) и выдал лог-анализатор (допустим, собственный, с многодетальной и полусырой информацией), весьма затруднительно или по крайней мере занимает много времени. Таким образом, идеальным решением, востребованным современным рынком статистических услуг в Интернете, был бы единый пакет программ, включающий как счетчик, который можно расположить на своем сервере, так и достаточно совершенный лог-анализатор. Именно такой подход позволил бы более смело, обоснованно и эффективно пользоваться статистикой при продвижении любого Интернет-проекта. К сожалению, чтобы "два в одном" заработало должным образом, качественно дополняя друг друга, необходимо не просто объединить под одной крышей первый попавшийся под руку счетчик с имеющимся в наличии лог-анализатором, а прописать программы специально друг под друга, заново - "от и до". А на это, увы, пока не решился ни один производитель программного обеспечения, обитающий на наших необъятных реальных и виртуальных просторах.

Версия для печати