【入門編】GA(Googleアナリティクス)の正規表現|概要や使い方をチェック

SEOサービスのご案内
今すぐ無料ダウンロード

無料で資料をダウンロード

※フォーム送信後、メールにて資料をお送りいたします。

SEOサービスのご案内

専属のコンサルタントが貴社Webサイトの課題発見から解決策の立案を行い、検索エンジンからの自然検索流入数向上のお手伝いをいたします。

※フォーム送信後、メールにて資料をお送りいたします。

STEP 1


フォームでの問い合わせが
完了いたしました。
メールにて資料をお送りいたします。

日々SEO対策などを意識して、Googleアナリティクスで数値の取得や分析を行っていると「特定の文字列を含むURLのデータだけ上手く抽出できないだろうか…」と悩むシーンがあります。企業のWeb担当者の皆さんも、URLの特定の文字列だけフィルタリングしようと試行錯誤したことがあるのではないでしょうか。そんなときに覚えておくべき、かゆいところに手が届くテクニックが「正規表現」です。本記事では、Googleアナリティクスで使用できる正規表現の種類や内容、活用方法について詳しく解説していきます。

次の記事では、Googleアナリティクスの基本的な使い方について解説しています。そもそもまだGoogleアナリティクスを使いこなせていないと感じる方は、こちらも参考にしてみてください。

そもそも正規表現とは

最初に正規表現の概要について理解しておきましょう。正規表現とは「様々な複数の文字列を、1つの文字列に置き換えた表記方法」です。これだけではピンと来ない方も多いでしょうから、以下に具体例を示します。

<複数の文字列>

  • SEO
  • MEO
  • EFO
  • LPO
  • TDO
  • CRO

<正規表現>※表記方法は複数あり

[A-Z][A-Z]O

上記のように正規表現を使用することで、複数の文字列を一つの文字列に置き換えることが可能です。では、いったい正規表現はどのようなときに役立つのでしょうか。それは、膨大なデータの中から任意の条件に合致するデータを検索する際です。

上記の例の「SEO」「MEO」…といった文字列を、100万のデータの中から探すシーンをイメージしてください。頭が痛くなりませんでしょうか。6個ぐらいであればひとつひとつ手作業で検索することも可能ですが、探す対象が100個にもなればそうも言ってられません。しかし、正規表現を使用し、検索する文字列を一まとめに置き換えてしまえば、検索作業は1回で済むのです。

もちろん、複雑な表記の習得には多少の学習時間が必要となりますが、一度覚えておけばデータを扱う様々な場面で応用が効きます。この機会にぜひ正規表現の基本を押さえておきましょう。

Googleアナリティクスの正規表現

Googleアナリティクスでもレポートなどの機能で、正規表現の使用することができます。正規表現を用いることで、柔軟なデータ抽出や文字列のパターンの指定が可能になるというわけですね。Googleアナリティクスでは、主に下記の機能で正規表現を活用できます。

  • ビューフィルタ
  • 目標(CV)
  • セグメント
  • ユーザーリスト
  • コンテンツグループ
  • チャネルグループ

Googleアナリティクスで使える正規表現

では、実際にGoogleアナリティクスで使用できる正規表現を解説します。Googleアナリティクスでは「メタ文字」と呼ばれる半角英数の記号文字などを組み合わせて表記し、必要なデータを抽出します。メタ文字にも複数の種類があるため、それぞれ確認していきましょう。

ワイルドカード

ワイルドカードは「〜文字以上」や「〜や〜の記号が入る」など任意の文字に置き換えられることを意味するメタ文字の種類です。

メタ文字説明
.任意の 1 文字(文字、数字、記号)に一致します。
?直前の文字が 0 回または 1 回出現する場合に一致します。
+直前の文字が 1 回以上出現する場合に一致します。
*直前の文字が 0 回以上出現する場合に一致します。
|OR 条件を作成します。
正規表現の末尾には使用できません。

”.” 任意の 1 文字(文字、数字、記号)に一致

「.(ドット)」は、文字や数字、記号など任意の1文字を指定する正規表現です。

  • 「1.」で一致するデータ:10、1A
  • 「1.1」で一致するデータ:111、1A1

”?” ”+” ”*” 繰り返し出現する場合に一致

「?(疑問符)」は直前の文字0回または1回の出現、「+(プラス記号)」は直前の文字が一回以上「連続」して出現、「*(アスタリスク)」は直前の文字が0回以上出現する場合に一致します。

  • 「10?」で一致するデータ:1、10
  • 「10+」で一致するデータ:10、100
  • 「1*」で一致するデータ:1、10

“|”  OR 条件に一致

「|(パイプ)」はOR条件(または)を指定します。ORの範囲を限定できる()(丸かっこ)と組み合わせて使用するケースが多いです。

  • 「1|10」で一致するデータ:1、10

アンカー

アンカーは、ある文字列が配置される「位置」を指定するメタ文字です。

^隣接する文字が文字列の先頭である場合に一致します
$隣接する文字が文字列の末尾である場合に一致します

”^” 隣接する文字が文字列の先頭である場合に一致

「^(キャレット)」は文字列の先頭からの前方一致を指定します。

  • 「^10」で一致するデータ:10、100、10x
  • 「^10」で一致しないデータ:110、110x

“$” 隣接する文字が文字列の末尾である場合に一致

「$(ドル記号)」は文字列の末尾から後方一致を指定します。

  • 「10$」で一致するデータ:110、1010
  • 「10$」で一致しないデータ:100、10x

グループ

グループは囲まれた文字列を、グループとしてひとまとめにして扱うことを意味するメタ文字です。

( )

囲まれた文字が同じ順序で文字列に含まれる場合に一致します

他の正規表現をグループ化する場合にも使用します

[ ]囲まれた文字が任意の順序で文字列に含まれる場合に一致します
角かっこ内の文字範囲が文字列に含まれる場合に一致します

“()” 同じ順序で文字列に含まれる場合に一致

「()丸かっこ」は、かっこで囲んだ範囲をグループ化します。「|(パイプ)」と組み合わせて使用することが多いです。

  • 「(10)」で一致するデータ:10101、1011
  • 「([0-9]|[a-z])」で一致するデータ:すべての数字と小文字

“[]” 任意の順序で文字列に含まれる場合に一致

「[]角かっこ」は、囲まれた文字列のいずれかを指定します。

  • 「[10]」で一致するデータ:012、120、210

“-” 角かっこ内の文字範囲が文字列に含まれる場合に一致

「-(ハイフン)」は角かっこと組み合わせて使用し、文字の範囲を指定します。

  • 「[0-9]」で一致するデータ: 0~9 のすべての数字

Googleアナリティクスでの正規表現の使用手順

では、上記で紹介したような正規表現はGoogleアナリティクスでどのように役立つのでしょうか。次に、実際にGoogleアナリティクスで正規表現を活用する主要なシーンを説明していきます。

特定のページのデータを絞り込んで確認する

正規表現を使えば、Googleアナリティクスで特定のページのデータを絞り込むことが可能です。データの絞り込みを行う際は、「セグメント(絞り込み)」を作成します。実際に「ユーザーサマリー」の機能で、正規表現を使用してみましょう。

  1. ユーザー > 概要 からユーザーサマリーを開く
  2. 「セグメントを追加」から「新しいセグメント」を選択
  3. ユーザー属性などの条件を指定する画面が表示される
  4. 左下の「条件」をクリック

今回は例として、URLが「/order/」からはじまるカテゴリのランディングページを絞り込む、正規表現を設定する流れを例にあげます。なお、「/order/」からはじまるURLを指定する正規表現は、「^/order/」と表記します。

  1. 任意のセグメント名を入力
  2. フィルタの項目で「ランディングページ」を選択(行動の項目にあります)
  3. 「含む」と表記されている部分を「正規表現に一致」に変更
  4. 枠内に「^/order/」を入力
  5. 「保存」をクリック

上記の手順で正規表現を設定すると、「/order/」からはじまるURLのみを抽出したレポートが作成できるようになります。

特定のIPアドレスを除外する

アクセス解析で取得するデータから特定のIPアドレスを除外したい場合にも、正規表現を用いることができます。企業で運営しているWebサイトのアクセス解析においては、「ページを閲覧した社員」のデータが混ざらないよう、社員のIPアドレスを除外することが多いですが、入力するIPアドレスが多いと骨が折れます。正規表現はこういったケースで活用すると非常に便利です。

同一サーバーで使用しているIPアドレスは、「123.456.78.●●●」など途中まで同じ数字が並ぶため、後半3桁の「●●●」の部分に正規表現を使用し、マッチさせることで社員のIPアドレスを除外する設定を行うのです。ちなみに、IPアドレス「123.456.78.●●●」の正規表現は「^123.456.78.[0-9][0-9][0-9]」となります。

設定手順は下記の通りです。

  1. Googleアナリティクスの「設定」からビュー列を選択
  2. 「フィルタ」をクリックしビューにフィルタを追加
  3. フィルタ名に任意の名前を入力
  4. フィルタの種類:カスタムを選択
  5. 「除外」にチェックをいれる
  6. フィルタフィールド:「IPアドレス」を選択
  7. 正規表現を入力して保存

まとめ:正規表現を活用しGoogleアナリティクス分析の効率化をはかろう

Googleアナリティクスの正規表現は、様々なデータを抽出したり条件に応じて除外や振り分けが行える便利な表記方法です。使いこなすには時間がかかるかも知れませんが、そこまで難易度が高いわけではありません。必要に応じて使ううちに慣れていくでしょう。まずは、当ページを見ながら、Googleアナリティクスで試しに正規表現を使用してみてください。

次の記事では、話題の「Googleアナリティクス 4 プロパティ(GA4)」と「ユニバーサルアナリティクス プロパティ (UA)」について解説しています。まだ移行について検討できていない方は、ぜひ参考にしてみてください。

成果に直結する、オウンドメディア立ち上げサービス