Apache Kafka® 是 一个分布式流处理平台. 这到底意味着什么呢?

Kafka的核心概念:提供一串流式的记录— topic 。

我们知道流处理平台有以下三种特性:

  1. 可以让你发布和订阅流式的记录。这一方面与消息队列或者企业消息系统类似。
  2. 可以储存流式的记录,并且有较好的容错性。
  3. 可以在流式记录产生时就进行处理。

适用场景:

     1. message queue:构造实时流数据管道,它可以在系统或应用之间可靠的获取数据。

     2. 流处理:构建实时流式应用程序,对这些流数据进行转换或影响。

一些概念:

    Kafka作为一个集群,运行在一台或者多台服务器上

    通过topic对存储的流数据进行分类

    每条记录包含key、value、timestamp

Kafka有四个核心的API:

  • The Producer API 允许一个应用程序发布一串流式的数据到一个或者多个Kafka topic。
  • The Consumer API 允许一个应用程序订阅一个或多个 topic ,并且对发布给他们的流式数据进行处理。
  • The Streams API 允许一个应用程序作为一个流处理器,消费一个或者多个topic产生的输入流,然后生产一个输出流到一个或多个topic中去,在输入输出流中进行有效的转换。
  • The Connector API 允许构建并运行可重用的生产者或者消费者,将Kafka topics连接到已存在的应用程序或者数据系统。比如,连接到一个关系型数据库,捕捉表(table)的所有变更内容。

kafka详解

 

 

具体内容可以参考官方文档:http://kafka.apachecn.org/documentation.html#introduction

 

相关文章:

  • 2022-12-23
  • 2021-04-05
  • 2021-05-16
  • 2021-10-08
  • 2021-08-31
  • 2021-08-04
  • 2021-09-07
猜你喜欢
  • 2021-08-17
  • 2021-04-18
相关资源
相似解决方案