【发布时间】:2014-12-12 04:47:31
【问题描述】:
作为高级 Google Analytics/BigQuery 客户,我们的问题是,哪些数据更准确?
我倾向于让 BigQuery 更准确,因为我们实际上可以看到原始数据,但我们不了解 Google Analyitcs 用于计算其数字的方法。
我也认为这在很大程度上与采样有关。
当您计算单个页面的总浏览量之类的简单数据时,Google Analytics(分析)数字在 .00001% 内与 BigQuery 对齐:
sum(regexp_match(hits.page.pagepath,r'(?i:/contact.aspx)') 和 hits.type = "page" then 1 else 0 end) as total_pageviews 的情况
当您计算更复杂的数据(例如单个网页的唯一身份浏览量)时,Google Analytics(分析)数字比 BigQuery 高 5%。请注意,它是按最大 100 万采样的:
count(distinct (regexp_match(hits.page.pagepath,r'(?i:/contact.aspx)') and hits.type = "page" then concat(fullvisitorid, string(visitid)) end) , 1000000) 作为 unique_pageviews
我很想知道其他人的想法或 Google 开发人员自己能解释什么。
【问题讨论】:
-
我建议阅读 stackoverflow.com/questions/16609219/… ,似乎是计数(可以在 BigQuery 中对不同的样本进行采样
标签: google-analytics google-bigquery