【发布时间】:2016-03-08 16:58:17
【问题描述】:
我了解 BigQuery 提供了 COUNT DISTINCT 的估计值,但是否有任何信息说明错误有多大以及它取决于什么样的参数?
谢谢
【问题讨论】:
-
也许您可以多次将其与 count(unique()) 进行比较。如果数据太大以至于 count(unique()) 甚至不起作用,那么这种方法可能不起作用。我认为是经验性的而不是理论性的。
-
您也可以改用 EXACT_COUNT_DISTINCT。 cloud.google.com/bigquery/query-reference#exact_count_distinct
标签: google-bigquery