【发布时间】:2017-12-23 19:57:50
【问题描述】:
我正在阅读this SO answer 和许多这样的博客。
我知道的:
当运行具有多个消费者组 ID 的多个消费者时,多个消费者可以在单个分区上运行,并且一个消费者组中只有一个消费者可以在给定时间从一个分区消费。
我的问题与多个消费者群体的多个消费者从同一主题消费有关:
如果多个消费者(不同的组)消费一个主题(最终是同一个分区)会发生什么?
他们得到相同的数据吗?
如何管理偏移量?是否对每个消费者分开?
(可能基于意见)您或通常推荐的方法是如何处理在单个分区上运行的单独组的两个使用者之间的重叠数据?
编辑: “重叠数据”:指在同一分区上运行的不同消费者组的两个消费者获得相同的数据。
【问题讨论】:
标签: apache-kafka bigdata