【发布时间】:2020-01-08 08:17:03
【问题描述】:
在 Kafka 中有 2 个设置 earliest 和 latest,您可以从主题的最早偏移量 (0) 或最新事件(对实时有用)进行读取
我现在将 PubSub 与 Dataflow 和 Beam 一起使用,但默认情况下,该作业似乎每次启动时都会从最早读取。如何配置它以使其仅读取最新记录?
latest 是 Kafka 中的默认值,谁能解释为什么这在 Pub/Sub 中不容易实现?
【问题讨论】:
标签: google-cloud-platform apache-kafka google-cloud-pubsub dataflow