【发布时间】:2018-10-19 04:01:31
【问题描述】:
我想跟踪 mongo oplog 并通过 Kafka 流式传输它。但是有很多数据库和集合,我只想获取其中一个的更新数据。如果要从 oplog 中的所有操作记录中过滤掉所需的操作记录,这会影响性能。所以我想寻求一个更好的解决方案。请给我一些建议。
【问题讨论】:
标签: mongodb apache-kafka apache-kafka-connect
我想跟踪 mongo oplog 并通过 Kafka 流式传输它。但是有很多数据库和集合,我只想获取其中一个的更新数据。如果要从 oplog 中的所有操作记录中过滤掉所需的操作记录,这会影响性能。所以我想寻求一个更好的解决方案。请给我一些建议。
【问题讨论】:
标签: mongodb apache-kafka apache-kafka-connect
不清楚您使用的是什么工具,但 Debezium 支持这些用于应用过滤
database.whitelistcollection.whitelist也不清楚什么会“影响性能”,因为您已经在阅读完整的 oplog,但是执行过滤器(意味着删除所有不匹配条件的记录)应该不会产生重大影响,因为布尔/正则表达式检查通常会完成很快。
【讨论】: