kafka之基本概念

kafka基本概念

kafka之基本概念

kafka之基本概念

kafka之基本概念

生产者即数据的发布者,该角色将消息发布到kafka的topic中,broker接收到生产者发送的消息后,
broker将该消息追加到当前用于追加数据的segment中,生产者发送的消息,存储到一个partition中,
生产者也可以指定数据存储的partition

leader:每个partition有多个副本,其中有且仅有一个座位leader,leader是当前负责数据的读写的partition
follower:follower跟随leader,所有写请求都通过leader路由,数据变更会广播给所有follower,
follower和leader保持数据同步,如果leader失效,则从follower中选举一个新的leader,当follower和leader
同时挂掉,卡住或者同步太慢,leader会把这个follower从""in sync replicas(ISR)"列表删除,重新创建一个follower
AR(Assigned Replicas):分区中所有的副本统称为AR
ISR(IN Sync Replicas):所有和leader部分保持一定程度的副本(包括leader)组成ISR
OSR(Out Of Sync Replicas):和leader副本同步滞后过多的副本
Zookeeper:Zookeeper负责维护和协调broker(节点),当kafka系统中新增了broker或者某个
broker发生故障失效时,由Zookeeper通知生产者和消费组,生产者和消费组依据Zookeeper的broker状态信息
和broker协调数据的发布和订阅任务
HW(high Watermark):高水位,标识一个特定的offset,消费组只能拉取到这个offset之前的消息
LEO(log End Offset):即日志末端唯一,记录该副本底层日志中下一条消息的位移值.是下一条消息,
如果LEO=10,标识该副本存储了10条消息,位移范围是[0,9]