【发布时间】:2016-02-21 20:40:43
【问题描述】:
我发现了几个相关的问题,但 Google 团队没有针对这个特定问题给出明确的答案:
写入 BigQuery 的 Cloud DataFlow 作业是否限制为 BigQuery 配额,即每表每秒 100K 行(即 BQ 流式传输限制)?
google dataflow write to bigquery table performance
Cloud DataFlow performance - are our times to be expected?
编辑: 主要动机是找到一种方法来预测各种输入大小的运行时间。
我已成功运行显示通过数据流监控 UI 处理的 > 180K 行/秒的作业。但我不确定这是否会在插入表时受到某种限制,因为作业运行时间比简单计算慢了大约 2 倍(500 毫米行/18 万行/秒 = 45 分钟,实际上花了将近 2 小时)
【问题讨论】:
标签: google-bigquery google-cloud-dataflow