Что такое логи

Одним из основных способов измерения (оценки) количества просмотров страниц является использование серверных логов, в которых сохраняются данные об HTTP-запросах к серверу. Лог сервера представляет собой текстовый файл, в каждой строке которого хранится информация об одном запросе к серверу.

Важно знать, что в зависимости от настроек сервера, в логах будут сохраняться:

  • Ошибочные запросы. Например, запрос несуществующей страницы или страницы, доступ к которой запрещен. В зависимости от настроек сервера и CMS сайта, такие запросы могут не приводить к отображению полноценной страницы сайта
  • Запросы к файлам, не являющимся страницей сайта (файлы PDF, Word, архивы и прочее) или являющиеся частью страницы (изображений, Flash-ролики, JS-скрипты, таблиц стилей и т. д.)
  • Запросы поисковых и других ботов

Таким образом, чтобы получить из серверных логов данные о просмотрах страниц необходимо сначала удалить из лог-файла запросы, не относящиеся к просмотрам страниц. Полученный «чистый» лог-файл готов для подсчета статистики просмотров страниц и дальнейшего анализа.

Пример строки названия полей и одной из записей лог-файла (сервер IIS):

date time s-sitename s-computername s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs-version cs(User-Agent) cs(Cookie) cs(Referer) cs-host sc-status sc-substatus sc-win32-status sc-bytes cs-bytes time-taken

2008-12-10 20:59:59 W3SVC1 BSS-001 145.120.5.131 GET /news/life/2009/01/21/page.html – 80 – 135.91.135.1 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+6.0) HomeGeographyPlaceID=2 facebook.com/ facebook.com 200 0 3 13559 953 437

Значимые для анализа просмотров страниц поля лог-файла:

Название поля Пример значения Что означает
date 2008-12-10 Дата запроса
time 20:59:59 Время запроса
cs-uri-stem /news/life/2009/page.html URI (то есть идентификатор) запрошенной страницы или файла. Фактически это кусок адреса URL страницы, который следует после названия хоста.
c-ip 135.91.135.1 IP-адрес посетителя, то есть адрес компьютера, с которого был отправлен запрос.
cs(User-Agent) Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0) Агент (программа), через которую был отправлен запрос. В обычных случаях это браузер.
cs(Cookie) GeographyPlaceID=2 Содержимое файла Cookie посетителя.
cs(Referer) facebook.com/ URL страницы, с которой был отправлен запрос. В обычных случаях — с какой страницы пользователь перешел на запрошенную страницу.
sc-status 200 Код ответа сервера.

На Unix-подобных серверах названия полей отличаются, но в целом их состав такой же. Надеюсь из моего обзора вы чуть больше узнали о том, что такое логи.