
Google Analytics — бесплатная программа, с помощью которой вы можете получить огромное количество данных о вашем сайте, а также о поведении посетителей. Основная проблем заключается в том, что нужно правильно сориентироваться в этом большом потоке данных, выбрать необходимые для анализа существующей ситуации, правильно их интерпретировать и принять на их основе верные решения для дальнейшего развития вашего сайта.
В этой статье речь пойдет об использовании регулярных выражений, которые можно использовать в поисковых запросах, для более эффективного использования данных из Google Analytics.
Что такое регулярные выражения?
Регулярные выражения — специальные символы, с помощью которых можно составлять строки символов для поиска или фильтрации данных. В программах веб-аналитики Google Analytics и Yandex Метрика поддерживаются применение регулярных выражений.
Где можно использовать регулярные выражения в Аналитике Гугла?
- фильтры в представлении (например, для фильтрации внутреннего трафика по IP-адреса, реферального спама и тд.)
- для фильтрации данных по определенным страницам
- составления пользовательских отчетов
- задания целей
- сегментации данных
- составления групп контента
- составления групп каналов
Так с помощью регулярных выражений можно составлять более сложные комбинации для фильтрации данных, чем стандартные возможности «с точным соответствием», «содержит», «начинается с», «заканчивается на».
Популярные регулярные выражения
Существует огромное количество регулярных выражений, и их использование кажется, на первый взгляд, сложным особенно для новичков. Но есть набор простых рег. Выражений, без использования которых в аналитике просто не обойтись.
Регулярное выражение | Значение | Пример |
---|---|---|
Любое слово | Содержит | Например, «tury» — будут показаны все URL, где встречается слово «tury» |
^ | Начинается с | ^tury – все URL, начинающиеся со слова tury |
$ | Заканчивается на | tury$ — будут показаны все URL, заканчивающиеся на слово tury |
| | или |
tury|otdyh – все URL, в которых в любом месте стоят слова или tury, или otdyh |
. | Любой символ | |
* | Предыдущий символ повторяется сколько угодно раз или нет | |
.* |
Сколько угодно любых символов |
|
\ | Преобразует любой символ регулярного выражения в обычный | |
[ ] | Перечисляет символы и один из них может встречаться в тексте | [0-9] — можно задавать диапазон цифр или букв |
Практические примеры использования регулярных выражений для Google Analitics
Возьмем для примера сайт о путешествиях www.example.com . В Google Analytics мы не будем использовать улучшенную атрибуцию ссылок, те URL адреса будут отображаться без example.com, а начинаться со слэша /tury-po-evrope, /tury-po-rossii и тд.
Исключение внутреннего трафика по IP-адресу
Для исключения внутреннего трафика в администраторе в нужном представлении создаем новый фильтр: тип встроенный, трафик с IP-адресов идентичный
Адрес обязательно нужно записать в виде регулярного выражения:
для одного адреса 74\.125\.2\.123
для диапазона адресов 74\.125\.[1-9]\..*
для нескольких адресов ^74\.125\.[1-9]\..*|^74\.125\.[1-9]\..*$
Использование регулярных выражений для задания цели «Посещение страницы»
Допустим одной из целей будет являться посещение нижеперечисленных страниц сайта:
/evropa-service
/rossia-service
/asia-service
Во всех адресах страниц повторяется слово service. Если предположить, что на сайте больше нет страниц с этим словом, то регулярное выражение может выглядеть следующим образом:
\/.*service
Если предположить, что на сайте есть еще разделы, в которых стоит service, а вашей целью является посещение трех вышеперечисленных, то регулярное выражение может выглядеть следующим образом:
\/(evropa|rossia|asia).service
Таким образом можно также создать собственные группы контента.
Использование регулярных выражения для расширенного поиска
Примеры для поиска по страницам:
^\/tury.*
— найдет страницы, в url которых встречается слово tury.
\.pdf$
— найдет страницы, URL которых заканчивается на pdf.
^/en/.*
— найдет страницы англоязычной версии сайта.
^\/[^/]*\/[^/]*\/?
— — найти все страницы, в URL которых содержится два раздела.
Расшифровка последнего примера:запись начинается со слэша ^\/, затем повторяется не слэш сколько угодно раз [^/]*, запись может заканчиваться слэшем или не \/?. В данном случае будут найдены такие страницы:
/tury-evropа/franzia
/tury-evropа/germania/
Примеры для поиска по ключевым словам:
(туры|экскурсии)
— в ключевых словах будут найдены слова «туры» и «экскурсии».
^\s*[^\s]+(\s+[^\s]+){0}\s*$
— сортировка по количеству ключевых слов. В данном случае будут определены запросы с одним ключевым словом.
Расшифровка последнего примера: Выражение может начинаться с любого количества пробелов или они могут отсутствовать ^\s*, затем идет сколько угодно непробелов [^\s]+. Выражение в круглых скобках повторяет примерно тот же смысл: \s+ — сколько угодно пробелов, [^\s]+ — сколько угодно непробелов. Выражение в фигурных скобках говорит, сколько раз дожно повторяться выражение в скобках. Поисковая фраза может заканчиваться на любое количество пробелов \s*$.
^\s*[^\s]+(\s+[^\s]+){1}\s*$
— будут определены запросы с двумя ключевыми словами.
^\s*[^\s]+(\s+[^\s]+){2}\s*$
— будут определены запросы с двумя ключевыми словами.
^\s*[^\s]+(\s+[^\s]+){6,}\s*$
— long tail, 7 и более ключевых слов.
Прежде чем использовать то или иное регулярное выражение в Google Analytics, лучше всего его протестировать. Мы используем для этого, например, онлайн-программу https://regex101.com/#javascript.