【发布时间】:2026-01-23 11:55:01
【问题描述】:
在 beam sdk 中,pubusbIO read 提供了一个使用消息 id 来删除重复消息的选项:https://beam.apache.org/releases/javadoc/2.23.0/org/apache/beam/sdk/io/gcp/pubsub/PubsubIO.Read.html#withIdAttribute-java.lang.String-
当我检查 Pubsub 客户端库(适用于 java 和 python)时,我没有看到使用消息 ID 删除重复消息的类似选项。
所以我的问题是:
- pubsub 客户端库(python 和 java)是否具有类似的功能?可能是因为命名不同而错过了。
- 如果他们不这样做,您将如何处理这种情况?我只是好奇它是如何作为灵感解决的。因为我正在考虑使用缓存来存储最近的消息 ID,以便在我的客户端应用程序中进行重复数据删除。
谢谢。
【问题讨论】:
标签: publish-subscribe google-cloud-pubsub