【发布时间】:2017-09-07 19:21:12
【问题描述】:
我正在考虑使用 Kafka 连接将更新从 Cassandra 流式传输到 Kafka 主题。 StreamReactor 的现有连接器似乎使用时间戳或 uuidtimestamp 来提取自上次轮询以来的新更改。在插入语句中使用 now() 插入时间戳的值。然后连接器保存上次接收的最长时间。
由于 Cassandra 最终是一致的,我想知道在使用时间范围进行重复查询以获取新更改时实际会发生什么。是否不会因为在使用 WHERE create >= maxTimeFoundSoFar 时“迟到”到查询的节点而错过插入 Cassandra 的行?
【问题讨论】:
标签: cassandra apache-kafka eventual-consistency apache-kafka-connect