GA4、Looker Studio、BigQuery それぞれチャネルの定義は異なるのか?チャネルのデータ構造とは?
企業やマーケティング担当者は、どの経路からWebサイトに訪問者が来ているのか知るためにチャネルごとに計測します。しかし、意外にマーケティングのチャネルに関しては、GA4ではどのようなデータ構造なのかを確認したことはなかったりしませんか。
今回は、マーケティングチャネルの定義について、Google Analytics 4(GA4)、Looker Studio(以前のGoogle Data Studio)、およびBigQueryでどのようにデータが扱われるかを説明し、解説します。
トラフィックソースの謎を解明、どのようなデータ構造なの?
GA4のスキーマには、テーブルのフィールド(列)やそのデータ型、リレーションシップ、制約などの情報が含まれます。スキーマには、ユーザー獲得に経路に関するインサイトを提供するために、2 つの異なるトラフィック ソース フィールド(collected_traffic_source、traffic_source)が組み込まれています。
下記はBigQueryに蓄積されたGA4のデータです。赤枠がトラフィック ソース フィールド(collected_traffic_source、traffic_source)です。
この2つのフィールドにはどんな違いがあるのでしょうか?
collected_traffic_source
このフィールドはセッションに関するトラフィックソースを提供し、セッションとそのイベントを最新のトラフィック ソースに関連付けることができます。
各セッションの詳細なトラフィックソース情報を保持し、手動で設定されたキャンペーンやメディア、ソースなどの情報を含みます。これは、マーケティング キャンペーンの効果を分析する場合に特に役立ちます。(2023 年 6 月に新しく追加されるようになったレコードです。)
下記のクエリを実行すると、手動で設定したトラフィック ソースを確認することができます。
traffic_source
ユーザーの初回訪問時のトラフィックソース情報を保持します。キャンペーン名、メディア (paid search, organic search)やソースネットワークなどの詳細が含まれます。
下記のクエリを実行すると、初回訪問時の流入経路がわかります。
collected_traffic_source、traffic_sourceのデータ構造とは
collected_traffic_source
collected_traffic_source は、手動で設定されたキャンペーン(campaign)やメディア(medium)、ソース(source)、用語(term)、コンテンツ(content)などの情報を含むフィールドが紐づけられます。
例えば、Emailキャンペーンの場合、URLに以下のようなパラメータを追加し、流入経路を計測します。
?utm_source=newsletter&utm_medium=email&utm_campaign=summer_sale
また、GoogleのクリックID(gclid)なども含まれています。主に広告キャンペーンや特定のトラフィックソースを追跡するために使用されます。
gclid (文字列):このフィールドには、Google クリック ID (使用可能な場合) が格納されます。
dclid (文字列):このフィールドには、Google マーケティング プラットフォーム (GMP) 識別子 (使用可能な場合) が格納されます。
srsltid (文字列):このフィールドには、Google Merchant Center 識別子 (使用可能な場合) が格納されます。
traffic_source
traffic_source は、GA4(Google Analytics 4 )が自動的に収集するトラフィックソース情報で、ユーザーの初回訪問時のトラフィックソースを保持します。Organic SearchやReferralなどの一般的なトラフィックソースを追跡するために使用されます。
name :ユーザーを最初に獲得したマーケティング キャンペーンの名前
medium :ユーザーを最初に獲得したメディアの名前 (Paid Social、Referral、Paid Search、Organic Socialなど) 。
source :ユーザーを最初に獲得したネットワークの名前
最初にユーザーを獲得した経路に関する履歴データを取得し、長期的な視点を提供します。
チャネルの定義
GA4 でのチャネルの定義
チャネルはトラフィックをより広範なカテゴリに分類するための概念です。チャネルは、トラフィックソースとメディアの組み合わせに基づいて定義されています。
デフォルトチャネルグループ
GA4には、初期設定としてデフォルトチャネルグループがあり、ユーザーのトラフィックソースに基づいて自動的に分類されます。これには、Organic Search、Direct、Paid Social、Referral、Paid Search、Organic Socialなどの一般的なチャネルが含まれます。
自動的に割り振られるので、パラメータはGA4の分類ロジックを意識すると良いでしょう。
以下は一般的なUTMパラメータの例です。
utm_source
: トラフィックソースを指定します(例:google、newsletter)。
utm_medium
: トラフィックのメディアを指定します(例:cpc、email、social)。
utm_campaign
: キャンペーン名を指定します(例:summer_sale、product_launch)。
utm_term
: 有料検索のキーワードを指定します(例:running+shoes)。
utm_content
: 広告やリンクの具体的なコンテンツを指定します(例:banner、email_footer)。
カスタムチャネルグループ
GA4では、特定のビジネスニーズに合わせてカスタムチャネルグループを作成することが可能です。ユーザーは、イベントやパラメータを基にして独自のチャネルグループを定義できます。
Looker Studioでのチャネルの定義
Looker Studioは、データを可視化するためのツールで、GA4を含むさまざまなデータソースからのデータを取り込んでレポートを作成します。
GA4のチャネル定義を利用
Looker Studioは、GA4のデータを直接接続して使用することができ、GA4のデフォルトチャネルグループやカスタムチャネルグループをそのまま利用してレポートを作成できます。
カスタムディメンションと計算フィールドの利用
Looker Studioでは、GA4から取得したデータを基にカスタムディメンションや計算フィールドを作成することで、独自のマーケティングチャネルを定義し、視覚化することができます。
BigQueryでのチャネルの定義
BigQueryは、Google Cloud上のデータウェアハウスで、大規模なデータセットを扱うのに適しています。GA4データをエクスポートして分析することができます。
GA4データをエクスポートし自由にクエリを実行できる
GA4のデータは、BigQueryに自動的にエクスポートすることが可能です。このエクスポートされたデータには、イベントデータやユーザーデータが含まれており、自由にクエリを実行して分析できます。
クエリによってチャネル定義できる
BigQueryでは、SQLクエリを使用してマーケティングチャネルをカスタム定義することができます。データセット内の様々なフィールドを利用して、特定の条件に基づくチャネルを柔軟に作成することが可能です。
下記はクエリを実行し、チャネルの割り振りとmedium/sourceの振り分けが上手くいっているのかスプレッドシートに表示しました。
「meta」はPaid Social に振り分けるのが正解ですが、未分類になっています。このようにクエリで漏れているものがないか、クエリの振り分けが正しいか確認することもできます。
BigQuery にデータをアップロードし、SQL を使用し、自社のマーケティング施策に合わせたチャネルをグループ化すると役立ちます。
BigQueryなどのDWHを活用しデータ構造理解へ
Google BigQuery を使用すると、大量のデータを読み込み、 SQL を使用してすばやく処理できます。レポートを自動化およびスケジュール設定できるため、チームはレポートの作成ではなく分析情報の取得に集中できます。
また、BigQueryを活用することで、データ構造を理解し、データを扱うことができます。どのようにキャンペーンの施策を追跡するか、どのようなパラメータやイベントを設定すべきかを検討し、最終的にはクエリを実行して集計します。
集計したデータは分析し活用できることがベストですが、一足飛びには行かないので、商習慣やカルチャーに合わせてデータを活用していける環境を作っていくことをおすすめします。
Google Analytics 4 から BigQuery へのデータのインポートは無料ですが、制限を超えると料金が発生します。 お困りのことがあれば、お手伝いいたします。お気軽にお問い合わせください。