【发布时间】:2021-07-29 01:53:09
【问题描述】:
我有一个用例,我想让成千上万的生产者编写消息,这些消息将被成千上万的相应消费者消费。每个生产者的消息只针对一个消费者。
回顾here 和here 的核心概念:似乎每个消费者-生产者对都应该有自己的主题。这是正确的理解吗?我也调查了消费者群体,但似乎他们更适合并行消费。
现在我有多个生产者-消费者对共享很少的主题,但正因为如此(我认为)我不得不读取消费者中的大量消息并通过密钥将它们过滤掉以获取特定生产者的消息。随着我的系统扩展,这可能需要很多时间。此外,如果我必须删除检查点,这将更加成问题,因为它从一开始就开始读取。
创建数千个主题是解决此问题的方法吗?或者还有其他方法可以使用分区、消费者组等概念吗?生产者和消费者都是火花流/批处理应用程序。谢谢。
【问题讨论】:
标签: apache-kafka