【发布时间】:2018-04-19 03:48:47
【问题描述】:
我目前正在尝试找到一种直接且高效的方法来使用 Kafka Streams 对记录进行分类。
所有记录都至少包含一个id 和一个failed 属性。
(id 只是一个字符串,failed 是布尔值)
这个想法是在一开始将所有传入的记录分类为“消息”。
一旦传入记录之一设置了失败字段,这应该在某处“持久化”,并且记录应该被归类为“失败”。
从现在开始,具有相同id 的传入记录也应归类为“失败”,无论是否设置了failed 属性。
我正在考虑使用 Kafka Streams 的内部状态存储(连同交互式查询功能)或每次输入记录时都会查询的外部数据库。我认为 Kafka 本身的状态存储听起来像更轻量级的解决方案。
有人知道如何以正确的方式解决这个问题吗?
谢谢 一切顺利 - 蒂姆
【问题讨论】:
标签: stream apache-kafka state apache-kafka-streams