【问题标题】:BiqQuery vs Google Analytics, which data is more accurate?BigQuery 与 Google Analytics,哪个数据更准确?
【发布时间】:2014-12-12 04:47:31
【问题描述】:

作为高级 Google Analytics/BigQuery 客户,我们的问题是,哪些数据更准确?

我倾向于让 BigQuery 更准确,因为我们实际上可以看到原始数据,但我们不了解 Google Analyitcs 用于计算其数字的方法。

我也认为这在很大程度上与采样有关。

当您计算单个页面的总浏览量之类的简单数据时,Google Analytics(分析)数字在 .00001% 内与 BigQuery 对齐:

sum(regexp_match(hits.page.pagepath,r'(?i:/contact.aspx)') 和 hits.type = "page" then 1 else 0 end) as total_pageviews 的情况

当您计算更复杂的数据(例如单个网页的唯一身份浏览量)时,Google Analytics(分析)数字比 BigQuery 高 5%。请注意,它是按最大 100 万采样的:

count(distinct (regexp_match(hits.page.pagepath,r'(?i:/contact.aspx)') and hits.type = "page" then concat(fullvisitorid, string(visitid)) end) , 1000000) 作为 unique_pageviews

我很想知道其他人的想法或 Google 开发人员自己能解释什么。

【问题讨论】:

标签: google-analytics google-bigquery


【解决方案1】:

如果您是高级客户,我认为这是因为您拥有一个包含大量数据的大型网站。如果数据过多,Google Analytics API 将对您的数据进行采样。您可以通过提高采样级别来尝试和防止这种情况。即使将采样级别设置为高精度,您仍然可以从 API 获取采样数据。

检查从 API 返回的 Json,它会告诉您是否正在对您的数据进行采样。

Big Query 不会对您的数据进行抽样,高级客户可以通过一种方法在不抽样数据的情况下使用 API,但我认为您必须联系 Google 进行设置。

Big Queries 更受青睐的一点是,您不会像使用 Google Analytics API 那样受限于 7 个维度和 10 个指标。

注意:我不是 Google 开发人员,但我是 Google Analytics(分析)的 Google 开发人员专家。

【讨论】:

  • @DalmTo,感谢您的回复!您确实是正确的,我们有一个包含大量数据的非常大的站点。您提到 API 很有趣。您是否知道 API 具有与浏览器 UI 不同的功能。我们两者都使用,但我们主要使用 UI 进行数据验证和初始查询构建以及 API 用于自动化和存储。我将尝试联系 Google 将帐户设置为不采样。这仅适用于 API 还是 UI 也可以设置为不采样?
  • 我不确定 UI 是否可以处理设置为非采样。我无权访问专业帐户,因此无法进行任何测试(使用它)。我个人想知道 UI 是否可以处理来自大帐户的非采样数据。联系 Google 看看他们怎么说。
【解决方案2】:

我是 BigQuery 的忠实粉丝。我也经常使用谷歌分析。所以问题是关于哪里的数据更准确。

嗯,这样的问题的答案总是:“数据越准确,越接近它的来源”。 BigQuery 是所有 Google 数据的底层存储。这是收集、索引数据,然后通过 SQL 接口访问数据的地方。

Google Analytics(分析)是一种为大量免费帐户而开发的工具。为了支持免费帐户,GA 需要很好地扩展。为了扩展,公司通过预先聚合数据来优化存储。

因此,您实际上是在比较两件事:预先汇总/预先汇总的数据 (GA) 和原始累积数据 (BigQuery)。你会相信哪个?

现在,听起来还有第二个问题:“如何从 BigQuery 获取准确的聚合?” BigQuery 充满了 ANSI 不兼容的 SQL,这对于临时查询来说很难记住。您最好在 BigQuery 之上连接一个 BI 工具,这样您就可以以一致的方式(即相同的阈值/舍入)探索数据。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-12-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-10-02
    • 2015-08-05
    相关资源
    最近更新 更多