【发布时间】:2019-06-09 09:21:26
【问题描述】:
我们在 GCP Dataflow 中运行管道,并遇到了 pubsub 消息 [1] 的最大消息大小 当这种情况发生时,管道延迟时间将开始增加,最终停止运行......
此日志消息是在 GCP 堆栈驱动程序中的“dataflow_step”下生成的,
我的问题,有没有办法在管道中定义错误处理...
.apply(PubsubIO.writeMessages()
.to("topic")
.withTimestampAttribute(Instant.now().toString()));
类似
.onError(...perform error handling ...)
以与 Java8 流 api 类似的流畅方式。这将允许管道继续使用 pubsub 限制内的输出。
非常欢迎使用其他解决方案来处理这种情况。
谢谢你, 克里斯托夫·布希耶
[1] 由于验证错误而无法提交请求:generic::invalid_argument: Pubsub 发布请求限制为 10MB,拒绝超过 7MB 的消息以避免超出 byte64 请求编码的限制。
【问题讨论】:
标签: apache-beam google-cloud-pubsub dataflow