【发布时间】:2019-04-13 19:21:17
【问题描述】:
背景: 我正在将 Firebase 分析数据导出到 BigQuery。我正在使用 cron 作业来处理 BigQuery 中的数据以获得洞察力。
问题: 为了能够仅处理增量数据,即自上次运行我的 cron 作业以来到达的数据,我需要一种方法来确定数据到达服务器的时间,因为生成了 event_timestamp在客户端,可以在发送前缓存在客户端。
见解: 我已经使用 event_server_timestamp_offset(偏移量)进行了实验,我认为我可以将其与 event_timestamp 一起使用。但我预计偏移量只会是正数,但也可能是负数。当我查看整个导出的 Firebase 分析数据集中的偏移量的 MAX 和 MIN 并将其重新计算为年而不是微秒时,我可以获得超过 18 年的偏移量。
查询:
SELECT
MAX(event_server_timestamp_offset)/(1000000*60*60*24) max_days,
MIN(event_server_timestamp_offset)/(1000000*60*60*24) min_days
FROM
`analytics_<project_id>.events_*`
结果:max_days=6784.485790436655, min_days=-106.95833052104166
问题:
- 如何确定 Firebase 导出的 BigQuery 数据的服务器到达时间,以便我可以运行仅处理增量数据的 cron 作业?
- 我可以将 event_server_timestamp_offset 与 event_timestamp 一起使用吗?如果有,怎么做?
最好的问候, 丹尼尔
【问题讨论】:
-
平平平平
-
你是如何解决这个问题的?我还认为使用 event_timestamp 和 event_server_timestamp_offset 可以获取服务器记录时间。不是这样吗?
标签: firebase google-bigquery firebase-analytics