【问题标题】:Google Analytics discrepancies谷歌分析差异
【发布时间】:2021-04-29 22:27:08
【问题描述】:

我有目标完成情况的谷歌分析报告,这与我在 BigQuery 中看到的不同。我正在使用以下查询来完成目标。差异非常小,大约在 1 到 20 之间。

SELECT
    distinct visitId
FROM
    `gcp_project.ganalytics.ga_sessions_*` AS sessions,
    UNNEST(hits) AS hits
WHERE
    regexp_contains(hits.page.pagepath, '/booking/complete*')
    and _table_suffix = '20210424'
    and totals.visits=1

gcp_project 位于美国地区,目标报告基于法国网页。时区有区别吗?

【问题讨论】:

  • 您是否尝试过将 fullVisitorId 和 visitId 结合起来,而不是仅仅结合 visitId?输出不同吗?另外,差异如何减少或增加?是否一致?
  • 它在 1 到 20 之间的变化非常小。
  • 您是否尝试更新您的 visitId?
  • 我希望你的意思是在 visitorid 和 fullvisitorId 之间使用 union all。是的,我做到了,但数量急剧增加。比预期值高 95%+。我试过 select distinct(visitorid) from (select visitiorid from union all select fullvisitorid from )

标签: google-analytics google-bigquery


【解决方案1】:
  1. 时区是一个因素。 BigQuery 导出数据集将采用 UTC,而在 GA UI 中,时区是用户为每个属性定义的。

  2. 在 GA UI 中,计数是使用 HyperLogLog 函数完成的近似值,而在 BigQuery 查询中,您执行的是常规 COUNT DISTINCT。 BigQuery 中的等效项是使用Approximate aggregate functions in Standard SQL。但是,即使这样,由于 GA 和 BigQuery 中 HyperLogLog 的实现方式不同,您也可能会有细微的差异。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-12-20
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多