【发布时间】:2018-02-12 10:45:25
【问题描述】:
我想知道什么最适合我:Kafka 流、Kafka 消费者 API 还是 Kafka 连接?
我想从主题中读取数据,然后进行一些处理并写入数据库。所以我写了消费者,但我觉得我可以编写 Kafka 流应用程序并使用它的有状态处理器来执行任何更改并将其写入数据库,这可以消除我的消费者代码并且只需要编写数据库代码。
我要插入记录的数据库是: HDFS -(插入原始 JSON) MSSQL - (处理过的 json)
另一个选项是 Kafka 连接,但我发现目前还没有对 hdfs sink 和 jdbc sink 连接器的 json 支持。(我不想用 avro 编写)并且对于复杂的嵌套消息来说,创建模式也很痛苦。
或者我应该编写自定义 Kafka 连接来执行此操作。
所以需要您对我应该编写 Kafka 消费者、Kafka 流还是 Kafka 连接提出意见吗? 什么会在性能方面更好并且开销更少?
【问题讨论】:
标签: apache-kafka kafka-consumer-api apache-kafka-streams apache-kafka-connect