【发布时间】:2020-04-05 00:40:12
【问题描述】:
使用 Google Dataflow 我需要从 Google spanner 读取数据并作为批处理写入 PubSub,我在 Spanner 中有超过 100000 条记录,所以我需要读取这些记录并使用 pubsub 批处理发布到 PubSub 主题中,1000 条记录将是每次发布迭代的限制。
请帮帮我
【问题讨论】:
-
你的错误是什么?你目前的破解密码是什么?你能分享更多细节吗?
-
是的,我们可以使用 pubsub io 编写,但我不想一次发布所有记录,因为我可能有大量数据,所以我需要拆分数据并作为多个发布请求发送,我没有找到这方面的文档,有什么办法可以做到这一点。
-
我了解到您不想在一条 PubSub 消息中发布 100k+ 行。我对吗?如果是这样,您要逐行发布到 PubSub 中吗?还是逐块(每块大约 1000 行)?
-
是的,你是对的,我想按 1000 行分块
-
您的查询输出中有行号吗?可以加一个吗?
标签: google-cloud-platform google-cloud-functions google-cloud-dataflow google-cloud-pubsub google-cloud-spanner