【发布时间】:2016-05-19 16:33:45
【问题描述】:
在尝试深入了解 Kafka 分发模型时,one sentence here from StackOverflow 让我嗡嗡作响,我无法确认也无法否认。
所以,你拥有的订阅者组越多,性能就越低,因为 kafka 需要将消息复制到所有这些组并保证总顺序。
据我从 Kafka 文档中了解到,多个消费者群体的行为类似于单一消费者。在代理中没有进行复制,因为每个消费者对于某个分区都有自己的偏移量。那么,组的数量应该不会产生任何显着的开销,所有的数据都在一个地方,只有偏移量不同。对吗?
如果这是正确的,那么实际上没有办法在不影响吞吐量的情况下引入多个不相交的消费者,因为所有消费者总是查询所有分区,并且引入了某种复制。请注意,这与消费者线程的数量无关,线程只会提高消费者性能,据我所知,它们不会干扰代理操作。
【问题讨论】:
标签: apache-kafka message-queue publish-subscribe messagebroker bigdata