Точность данных в Google Analytics

Многим известно, что не бывает инструментов веб-аналитики, которые идеально подсчитывают всю статистику. Данные Google Analytics (GA) также не претендуют на абсолютную точность. Так, например, вопросы точности данных могут возникнуть у вас при сравнении показателей GA с данными Яндекс.Метрики или других систем интернет-статистики. В данной статье будет подробно рассмотрен вопрос точности и корректности данных Google Analytics.

Существует множество причин, по которым статистика Google Analytics не является абсолютно точной, но со многими из них сталкиваются пользователи и других систем веб-аналитики, так как они используют схожие технологии, например, JavaScript-дескрипторы и cookie-файлы.

В целом, причины неточности подсчета можно разделить на две категории:

  • проблемы, которые зависят целиком от вашего сайта и настроек отслеживания, и, следовательно, вы их можете исправить;
  • проблемы, не зависящие от вас, исправить которые вы не можете.

Далее мы рассмотрим эти проблемы более подробно и постараемся найти пути их решения.

Как можно сделать свою статистику более точной?

Давайте начнем с тех проблем, которые вы можете исправить.

1  Не на всех страницах установлен код отслеживания

Google Analytics работает только на тех страницах, на которых установлен код отслеживания (Google Analytics Tracking Code). Если на странице нет кода отслеживания, то в GA не будет никаких данных по этой странице: ни посещений, ни просмотров, ни каких-либо других показателей.

В данной статье описаны некоторые методы отладки кода GA, например, с помощью специального расширения для браузера Google Chrome.

2  Код отслеживания неверно расположен

Многие вебмастеры и владельцы сайтов обеспокоены скоростью загрузки страниц. И это правильно. Но, как следствие, часто код GA размещают перед закрывающим тегом </body>, для того чтобы различные элементы сайта загрузились до выполнения JS-кода.

Google рекомендует размещать код трекинга Google Analytics перед закрывающим тегом </head>. Размещая JS-код Google Analytics в конце<body>, вы рискуете не посчитать посетителей, которые успеют перейти по любой другой ссылке сайта раньше, чем выполнится код отслеживания. Учитывая сегодняшние «раздутые» страницы, объемы которых порой достигают 2 МБ (и это не предел!), вероятность такого перехода крайне высока.

Код ga.js весит 15 КБ. Разместив его в <head>, вы не проиграете во времени, зато точно выиграете в корректности подсчетов статистики.

3  Множество кодов отслеживания на одном ресурсе

Не допускайте дублирования одинаковых кодов отслеживания, иначе путаницы в данных не избежать.

4  Ошибки JavaScript

Если на страницах вашего сайта часто возникают ошибки при выполнении JS-кода, то это может стать причиной некорректного подсчета статистики. Дело в том, что при возникновении ошибки в каком-либо JS-скрипте на странице, может быть остановлен движок JavaScript в браузере и, как результат, не будет выполнен код отслеживания GA. Поэтому важно, чтобы все скрипты JS на страницах работали корректно.

5  Ошибки в синтаксисе кода отслеживания

Методы, используемые в коде отслеживания GA, чувствительны к регистру, поэтому важно следить за тем, чтобы имена методов были написаны правильно. Например:

_gaq.push([’_trackPageview’])

а не

_gaq.push([’_trackPageView’])

или

_gaq.push([’_trackpageview’])

Если вы используете нестандартные методы отслеживания, например _trackTrans() для отслеживания транзакций в электронной коммерции или _setDomainName() для кросс-доменного отслеживания, то обязательно проследите за корректностью написания наименований данных методов.

Содержание лишних пробелов в аргументах функций также расценивается как ошибка синтаксиса. Например, данный участок кода выполнен не будет:

_gaq.push([’_setAccount’, 'UA-65432-1']);

Также идентификатор аккаунта обязательно должен содержать UA. Его отсутствие является одной из самых частых ошибок при первичной настройке кода.

6  Подсчет собственных посещений

Как часто вы посещаете свой собственный сайт? Частота посещений сайта вами или другими сотрудниками вашей компании может искажать общую статистику посещаемости. Для того чтобы избежать возникновения данной погрешности, можно использовать блокировщик Google Analytics, представляющий собой расширение ко всем наиболее популярным браузерам.

В случае если в вашей компании работает большое число сотрудников, то наиболее подходящим вариантом является создание специального профиля, который будет исключать данные посещений сотрудников компании. Создайте профиль и примените фильтр, исключающий трафик из вашей сети.

7  Некорректная настройка utm-меток

Для грамотного отслеживания различных рекламных кампаний (РК), будь то контекстная реклама, баннерная реклама или другие виды РК, следует использовать инструмент персонализированных кампаний. Его применение поможет вам точно отслеживать эффективность своих кампаний. С рекомендациями по настройке этого инструмента можно ознакомиться здесь. Функционал персонализированных кампаний реализуется за счет добавления к URL-адресам специальных UTM-меток.

Очень часто при ведении рекламных кампаний в Яндекс.Директе рекламодатели забывают о немаловажном факте: если не задать URL-адресам в объявлениях UTM-метки, то все посещения с объявлений Директа в поисковой выдаче будут засчитаны Google Analytics как обычные переходы из поисковых систем и отнесены к сегменту бесплатного поискового трафика. В Google AdWords можно настроить функцию автоматической пометки, и тогда присваивать метки вручную будет не нужно. Но если метки вообще отсутствуют, то это также приведет к смешению оплачиваемого трафика с бесплатным. Эти ошибки приводят к критичной невозможности корректной оценки объемов естественного поискового трафика. Поэтому, если вы используете контекстную рекламу, следите за чистотой собственной статистики — настраивайте метки.

И все равно ваша статистика будет неполной

К сожалению, это так. Даже если вы корректно настроили все на вашем сайте, то часть посетителей будет не учтена или посчитана неправильно. И вот несколько причин, по которым это происходит:

1  В браузере не включен JavaScript

Если у пользователя отключен JavaScript, то код отслеживания выполняться не будет. Процент пользователей, у которых в браузере отключен JavaScript, по разным оценкам составляет до 2%. Поэтому данная проблема носит несущественный характер.

2  Отключение или удаление cookie-файлов

Для присваивания каждому пользователю уникальных параметров GA использует несколько cookie-файлов, которые позволяют идентифицировать пользователя как уникального посетителя и хранить данные о его сессии. На основе всех данных, хранящихся в cookie-файлах, позже рассчитываются различные метрики. Отсюда вытекает целый ряд проблем, связанных с cookie-файлами:

  • у пользователя может быть отключен прием cookie-файлов в браузере, тогда его посещение не будет зарегистрировано GA;
  • если пользователь (или специальное программное обеспечение на компьютере пользователя) периодически очищает cookie-файлы, то это вносит погрешность в расчет различных показателей, связанных с последовательностью пользовательских сессий, т.к. после того как cookie-файлы удалены, переход на сайт будет засчитываться как новое уникальное посещение, даже если пользователь уже побывал на сайте.

3  Срок действия cookie-файлов

Google Analytics использует несколько cookie-файлов. Но основными являются два вида:

  • _utma. Создаются при первом вашем посещении веб-сайта и хранятся 2 года, до тех пор, пока вы их не удалите или не переустановите браузер. Они нужны, чтобы в следующее посещение идентифицировать вас как посетителя, уже заходившего на сайт. Обновляются на 2 года при каждом новом посещении.
  • _utmb. Создаются при каждом вашем новом посещении веб-сайта. Их срок действия составляет 30 минут, и они регулярно обновляются, когда вы совершаете какое-либо действие на сайте, приводящее к вызову одного из методов GA.

Таким образом, если utmb cookie-файл не обновляется на протяжении 30 минут, то он становится неактивным.

Например, если вы посмотрели веб-страницу, отошли на час от компьютера, оставив открытой вкладку, а затем снова вернулись к посещению этого сайта, то ваше посещение будет зарегистрировано GA как два разных посещения. Насколько это может исказить вашу статистику — это очень субъективный вопрос, ответ на который зависит от особенностей аудитории вашего сайта.

4  Одно устройство, несколько пользователей

Эта ситуация лучше всего иллюстрируется примером:

Пользователь A посетил сайт site.ru в первый раз, в браузере появился cookie-файл utma. На следующий день пользователь B с того же компьютера совершает свое первое посещение веб-сайта site.ru. По факту, два различных пользователя, возможно с разными целями, зашли на сайт в первый раз, но т.к. метрика уникальных посетителей связана с cookies, то будет зафиксирован один уникальный посетитель и два посещения.

5  Один пользователь, разные устройства

С распространением мобильных технологий наши посещения сайтов уже не привязаны к одному устройству. По дороге на работу мы можем зайти на сайт нового интернет-магазина со своего смартфона, чтобы ознакомиться с предлагаемым ассортиментом. Днем, находясь на работе, мы несколько раз посетим этот сайт, чтобы определиться с подходящим товаром. А вечером оформим заказ со своего ноутбука. Таким образом, за один день мы создадим трех уникальных посетителей, и в итоге покупка будет зарегистрирована GA как покупка, совершенная в первое посещение, хотя это далеко не так.

6  Данные обрабатываются не сразу

Несмотря на то, что у Google Analytics есть функционал отчетов в режиме реального времени, лишь некоторая часть метрик отображается в них. Для остальных метрик расчет производится намного позднее: от 4-5 часов до суток. Оптимальным вариантом будет работа с данными за прошлый календарный день.

7  Семплирование

Если на ваш сайт приходит большое число посетителей, то при запросе определенных отчетов вы можете увидеть сообщение о том, что данный отчет основан на выборке данных. Это означает, что при построении данного отчета Google Analytics использует не все данные с целью повышения производительности. Подробнее о семплировании можно почитать здесь.

В заключение

Итак, вы никогда не получите идеальной статистики посещаемости. С этим стоит просто смириться. Но при корректной настройке кода отслеживания на сайте Google Analytics можно добиться достаточно высокой точности, которой хватит, чтобы сделать действенные выводы на основе анализа данных.