【发布时间】:2019-05-14 12:33:47
【问题描述】:
我将在 BiqQuery 中获取大约 500,000 到 1,000,000 行。我们将其限制为偏移量和最大值。在这种情况下pageSize = max 和startIndex = offset。
我们的数据每天只会处理一次,然后上传到 BigQuery。
文档建议使用pageToken 而不是startIndex。
我使用pageToken 和startIndex 做了一些估计,看不出有任何时间差异。
我在 StackOverflow 找到了一个答案:
“您应该使用从原始查询响应或之前的
jobs.getQueryResults()调用返回的页面令牌来迭代页面。这通常比使用基于索引的分页更有效和可靠”
但我不相信为什么要使用pageToken,那么我需要存储令牌以在来回时使用它。从时间上看,我看不出有什么不同。
【问题讨论】:
标签: java google-bigquery