【发布时间】:2018-12-07 17:46:18
【问题描述】:
连接到 BigQuery 和 BQ 表架构的 Firebase Analytics 如下所述:
https://support.google.com/firebase/answer/7029846
我想了解如何唯一标识每个事件记录。
本来我以为是a的组合
user_pseudo_id 和 event_timestamp
是独一无二的。但我发现它并不是唯一的......
我在“分组依据”中添加了:event_date、event_name、event_previous_timestamp、stream_id等子句,但没有任何帮助。
谁能告诉我,是什么让事件记录与众不同?
【问题讨论】:
-
你想要达到什么目的?您可能有一种方法可以在没有每个事件的唯一 ID 的情况下执行此操作。
-
嗨@Vesper - 我正在尝试了解一系列事件 - 用于漏斗分析。当我在表中遇到几行相同的行时 - 我不确定 - 要选择其中的哪一个,以及为什么我有 9 条(或任何其他数量)记录而不是 1 条。
-
嗨。如果您能在问题中澄清/举例说明您的问题,这将有所帮助。产生这些相同行的查询也会有所帮助。
-
好的。由于 Google 改变了 BQ 接受 Firebase Analytics 数据的方式(对我而言,这意味着自 2018 年 6 月 25 日起),因此有 4 次数据夜间摄取。因此,我有 18 281 681 个事件。其中,178 309 条不同的事件记录有重复,因此重复的数量为 364 224。因此,冗余记录的数量为 364 224 - 178 309 = 185 915 或大约记录总数的 1%。
-
查询太长,无法插入。我只是取所有列,按它们分组并计算组中记录数> 1的案例
标签: firebase google-cloud-platform google-bigquery firebase-analytics