GA4のデータをBigQuery&SQLで分析するときのポイント3選! データ構造とよく使うクエリを知ろう
[参照元] Timestamp functions | BigQuery | Google Cloud
「DATE関数」を使用して、event_timestampからタイムゾーンを指定して日付データを取得することも可能です。
【補足】 GA4とBigQueryでタイムゾーンが一致していることを確認しましょう。 タイムゾーンが一致していない場合は、抽出・集計に使用したいタイムゾーンを指定するクエリを忘れないようにしましょう。
[参照元] [GA4] アナリティクス レポートと BigQuery にエクスポートされたデータを比較する - アナリティクス ヘルプ
■ よく使うクエリ
今回は、2021年1月1日から2021年1月3日のセッション数を出すクエリを例として、上記で説明した3つのデータ構造の特徴に対応するクエリを解説します。
WITH prep AS ( SELECT PARSE_DATE('%Y%m%d', event_date) AS date ---日付型に変更 ,user_pseudo_id ,(SELECT value.int_value FROM UNNEST(event_params) WHERE key = 'ga_session_id') AS ga_session_id ---ネスト(入れ子)構造を解消 FROM `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_*` ---ワイルドカード指定 WHERE _TABLE_SUFFIX BETWEEN '20210101' AND '20210103'---_TABLE_SUFFIXで複数テーブルを対象にして期間指定する ) SELECT date ,COUNT(DISTINCT CONCAT(user_pseudo_id, ga_session_id)) AS session_count FROM prep GROUP BY date ORDER BY date ;