Использование регулярных выражений в Google Analytics
08Сен

Google Analytics — бесплатная программа, с помощью которой вы можете получить огромное количество данных о вашем сайте, а также о поведении посетителей. Основная проблем заключается в том, что нужно правильно сориентироваться в этом большом потоке данных, выбрать необходимые для анализа существующей ситуации, правильно их интерпретировать и принять на их основе верные решения для дальнейшего развития вашего сайта.
В этой статье речь пойдет об использовании регулярных выражений, которые можно использовать в поисковых запросах, для более эффективного использования данных из Google Analytics.

Что такое регулярные выражения?

Регулярные выражения — специальные символы, с помощью которых можно составлять строки символов для поиска или фильтрации данных. В программах веб-аналитики Google Analytics и Yandex Метрика поддерживаются применение регулярных выражений.

Где можно использовать регулярные выражения в Аналитике Гугла?

  • фильтры в представлении (например, для фильтрации внутреннего трафика по IP-адреса, реферального спама и тд.)
  • для фильтрации данных по определенным страницам
  • составления пользовательских отчетов
  • задания целей
  • сегментации данных
  • составления групп контента
  • составления групп каналов

Так с помощью регулярных выражений можно составлять более сложные комбинации для фильтрации данных, чем стандартные возможности «с точным соответствием», «содержит», «начинается с», «заканчивается на».

Популярные регулярные выражения

Существует огромное количество регулярных выражений, и их использование кажется, на первый взгляд, сложным особенно для новичков. Но есть набор простых рег. Выражений, без использования которых в аналитике просто не обойтись.

 

Регулярное выражение Значение Пример
Любое слово Содержит Например, «tury» — будут показаны все URL, где встречается слово «tury»
^ Начинается с ^tury – все URL, начинающиеся со слова tury
$ Заканчивается на tury$ — будут показаны все URL, заканчивающиеся на слово tury
| или

tury|otdyh – все URL, в которых в любом месте стоят слова или tury, или otdyh

. Любой символ
* Предыдущий символ повторяется сколько угодно раз или нет
.*

Сколько угодно любых символов

\ Преобразует любой символ регулярного выражения в обычный
[ ] Перечисляет символы и один из них может встречаться в тексте [0-9] — можно задавать диапазон цифр или букв

 

Практические примеры использования регулярных выражений для Google Analitics

Возьмем для примера сайт о путешествиях www.example.com . В Google Analytics мы не будем использовать улучшенную атрибуцию ссылок, те URL адреса будут отображаться без example.com, а начинаться со слэша /tury-po-evrope, /tury-po-rossii и тд.

Исключение внутреннего трафика по IP-адресу

Для исключения внутреннего трафика в администраторе в нужном представлении создаем новый фильтр: тип встроенный, трафик с IP-адресов идентичный

Адрес обязательно нужно записать в виде регулярного выражения:

для одного адреса 74\.125\.2\.123
для диапазона адресов 74\.125\.[1-9]\..*
для нескольких адресов ^74\.125\.[1-9]\..*|^74\.125\.[1-9]\..*$

Использование регулярных выражений для задания цели «Посещение страницы»

Допустим одной из целей будет являться посещение нижеперечисленных страниц сайта:
/evropa-service
/rossia-service
/asia-service
Во всех адресах страниц повторяется слово service. Если предположить, что на сайте больше нет страниц с этим словом, то регулярное выражение может выглядеть следующим образом:

\/.*service

Если предположить, что на сайте есть еще разделы, в которых стоит service, а вашей целью является посещение трех вышеперечисленных, то регулярное выражение может выглядеть следующим образом:

\/(evropa|rossia|asia).service

Таким образом можно также создать собственные группы контента.

Использование регулярных выражения для расширенного поиска

Примеры для поиска по страницам:

^\/tury.*

— найдет страницы, в url которых встречается слово tury.

\.pdf$

— найдет страницы, URL которых заканчивается на pdf.

^/en/.*

— найдет страницы англоязычной версии сайта.

^\/[^/]*\/[^/]*\/?

— — найти все страницы, в URL которых содержится два раздела.
Расшифровка последнего примера:запись начинается со слэша ^\/, затем повторяется не слэш сколько угодно раз [^/]*, запись может заканчиваться слэшем или не \/?. В данном случае будут найдены такие страницы:
/tury-evropа/franzia
/tury-evropа/germania/

Примеры для поиска по ключевым словам:

(туры|экскурсии)

— в ключевых словах будут найдены слова «туры» и «экскурсии».

^\s*[^\s]+(\s+[^\s]+){0}\s*$

— сортировка по количеству ключевых слов. В данном случае будут определены запросы с одним ключевым словом.
Расшифровка последнего примера: Выражение может начинаться с любого количества пробелов или они могут отсутствовать ^\s*, затем идет сколько угодно непробелов [^\s]+. Выражение в круглых скобках повторяет примерно тот же смысл: \s+ — сколько угодно пробелов, [^\s]+ — сколько угодно непробелов. Выражение в фигурных скобках говорит, сколько раз дожно повторяться выражение в скобках. Поисковая фраза может заканчиваться на любое количество пробелов \s*$.

^\s*[^\s]+(\s+[^\s]+){1}\s*$

— будут определены запросы с двумя ключевыми словами.

^\s*[^\s]+(\s+[^\s]+){2}\s*$

— будут определены запросы с двумя ключевыми словами.

^\s*[^\s]+(\s+[^\s]+){6,}\s*$

— long tail, 7 и более ключевых слов.
Прежде чем использовать то или иное регулярное выражение в Google Analytics, лучше всего его протестировать. Мы используем для этого, например, онлайн-программу https://regex101.com/#javascript.