Статистика пользователей – это один из самых важных факторов при продвижении сайтов или блогов. Никто не поспорит с тем, что та информация, которая доступна благодаря статистике, является очень полезной и необходимой в анализе своего ресурса, а иногда и чужого 😉 О статистике вообще можно говорить долго, вот я и решил также “потанцевать” на эту тему 🙂
Статистика может быть внутренней, т.е. встроенная в движок, либо прикручена благодаря плагинам, как например в WordPress плагин mySTAT. Также — “внешней”, т.е. подсчитываться благодаря сервисам статистики с помощью установки их кодов на страницы ресурса. Самые популярные их таких сервисов среди блоггеров – это Google Analytics и LiveInternet. А как же все-таки они все работают? Вот об этом как раз и хотелось поговорить…
При обращении пользователя к сайту происходит сразу несколько событий:
1. Клиент передает на WWW-сервер запрос на выдачу страницы, при этом на сервере становятся известны:
а) обязательные параметры: IP-адрес клиента, запрашиваемый URL, дата и время запроса. По IP-адресу можно определить географическое положение клиента
b) Дополнительные (необязательные, но обычно передаваемые) параметры: используемое клиентом ПО, URL документа с которого произошел переход, имя пользователя и пароль для защищенных страниц и т.д
2. Сервер возвращает клиенту запрошенный документ (HTML или картинку)
3. Сервер записывает данные о произошедшей транзакции в журнальный файл (log-файл)
Для подсчета посетителей используется технология «cookie», которая заключается в следующем:
1. при первом посещении сайта клиентскому браузеру выдается уникальный идентификатор (cookie), по сути это простая текстовая строчка.
2. при последующих просмотрах страниц сайта, браузер сообщает этот идентификатор выдавшему сайту (и только ему), таким образом можно отследить как нескольких пользователей, приходящих с одного IP-адреса, так и одного пользователя, приходящего с разных IP-адресов.
На сегодняшний день для большинства сайтов этот метод является единственным способом отследить пользователей без их регистрации (и последующего ввода имени-пароля). В то же время, cookie у пользователя теряют по многим причинам: согласно современным оценкам от 10 до 30% пользователей в течение месяца очищают (или теряют) cookie. Это приводит к тому, что оценка количества новых пользователей оказывается завышенной.
Реальная жизнь несколько сложнее описанной выше простой схемы. К сожалению точность иногда хромает, а подсчет статистики сайта затрудняется по следующим причинам:
— часть пользователей выходит в интернет с разделением одного IP-адреса между многими пользователями. Это происходит при разделении одного ADSL-соединения между несколькими клиентами, при использовании корпоративных «серверов-посредников» (proxy server) и т.п.
— часть пользователей меняет свой IP-адрес в процессе работы (восстановление после обрыва dialup-соединения может происходить со сменой адреса)
— используются персональные и корпоративные «файрволлы» (firewall) и анонимизаторы, которые не дают передавать cookies и другие необязательные данные запроса
— часть обращений к сайтам не происходит т.к. страница берется с локального диска пользователя (если она была скачана ранее) или из WWW-акселератора провайдера (если другие пользователи провайдера уже обращались к данной странице)
Вследствие этих причин, полученные статистическими сервисами данные отличаются от реальных. Не существует каких-то корректных способов оценить величину отклонения «реальности» от измеренных характеристик, однако обычно отклонения не превышают 5-10%. В то же время, если аудитория сайта достаточно велика и нет оснований полагать, что она резко меняется (например, вследствие активной рекламы на ресурсах с большой посещаемостью), то можно считать ошибку измерения постоянной и успешно сравнивать данные по соседним дням, неделям, месяцам.
О том какая статистика предоставляется, благодаря чему и что можно из нее извлечь – поговорим в следующий раз 😉
А сейчас хотелось бы рассказать об очень оригинальном времени препровождении в блогосфере. Это кроссворд от Павла – prodvinemvmeste.ru. Разгадывание этого кроссорда не является конкурсом, а является простым развлечением и проверки своего блогосферного склада ума 🙂 Все вопросы как раз таки посвящены блогосфере, ну и конечно блогу автора.
Есть два варианта разгадывания кроссворда – прямо на сайте, либо распечатать и разгадывать ручечкой 🙂 В общем, неплохой способ немного развлечься, отдохнуть и проверить свои знания 😉
Vlad 03.02.2009
Незнаю как вам, по мне так кроме Google Analytics ничего собственно и не требуется — вся инфа которая нужна имеется в избытке и разложена по полками…ну да вы наверно уже в курсе моих предпочтений :))
AngelOfFate 04.02.2009
как не странно, но да Googla Analytics наиболее проработан во всех смыслах…сам правда пока пользуюсь несколькими =)