【发布时间】:2019-01-07 00:22:27
【问题描述】:
kafka 添加了在连接器中使用正则表达式的新功能,但是似乎连接器启动后来自新添加主题的主题数据在连接器重新启动之前不会被消耗。我们需要动态添加新主题,并让连接器根据连接器属性中定义的正则表达式使用主题。如何实现? 例如:正则表达式:topic-.* 主题:主题1,主题2 如果我引入了新的主题 topic-3,那么如何让连接器在不重启的情况下消费主题数据?
【问题讨论】:
-
正如Slack 组中所讨论的,Kafka Connect 只会在连接器启动时处理正则表达式。如果在此之后正则表达式的结果发生变化,则连接器不会选择新的结果。您希望多久添加一次新主题?
-
目前可以每两周或一个月添加一次主题,但我们确信频率会增加。我正在寻找的是是否可以为上述用例采用任何替代方案,以及每次重新启动连接器时重新启动连接器的含义。我了解 kafka 连接器具有偏移管理并保证消息的传递,但是,如果您能提供一些关于生产环境下连接器重启的影响的资源,将会有所帮助。
-
为什么不做一个新的连接器呢?与仅尝试从不断增长的主题中消耗最多 N 个任务相比,这将具有更好的扩展性和更高的容错性
标签: apache-kafka apache-kafka-connect confluent-platform