【发布时间】:2018-11-05 15:58:35
【问题描述】:
我正在将数据流式传输到 bigquery 并且日志根本没有记录任何问题,当我运行 "SELECT * FROM datatable WHERE _PARTITIONTIME = TIMESTAMP("2018-11-05") LIMIT 1000" 它只返回 16 行,行数据随着新数据的流入而不断变化,但只返回16行。
Streaming 缓冲区统计显示缓冲区中有行。
我大约 10 小时前开始直播,所以我假设会有一些数据可以访问。
我在这里有点茫然,因为我看不到错误
这是收集到的一些样本数据
https://docs.google.com/spreadsheets/d/1Svm6cDWzSvD0RHGo_O5J16UDvqFfDAK5irNki5nYtos/edit?usp=sharing
【问题讨论】:
-
您能否提供有关如何流式传输数据的详细信息?我想验证您是否经常覆盖前 16 行。
-
我正在使用这个link
-
似乎覆盖了,Streaming 缓冲区统计信息一直显示插入日志中的实际行,但实际表保持不变。
-
有些数据在 Streaming Buffer 中而不在表中的事实应该是无关紧要的。这是内部的,数据一插入(到流缓冲区或表中)就应该被查询。 - 查询分区表的详细信息cloud.google.com/bigquery/docs/querying- partitioned-tables - 一段时间内数据可能会停留在UNPARTITIONED分区cloud.google.com/bigquery/docs/…
标签: google-bigquery