【发布时间】:2020-10-08 00:23:29
【问题描述】:
我是 Kafka Connect 的新手。
场景:我们想要导出存储在 Kafka 中的多个(好数量 > 400)主题中的数据,并将该数据转储到 Elastic Search 索引中。我们公司的 Kafka 是 Confluent Kafka 并且是 Kerberized。我可以通过 Kafka API 编写生产者和消费者,因为我们知道代理并拥有 keytab 文件。
建议使用 Kafka-Connect,但由于它是多租户集群,运维团队可能无法提供直接访问,甚至无法运行插件安装命令。我们有自己的托管虚拟机,我们在其中部署应用程序实例。
问题 - 是否可以通过在我们的 VM 上安装连接器插件而不是在 Confluent Kafka 上安装它们来以分布式模式运行 Kafka-Connect?我们可以在 Confluent Kafka 上不运行任何命令的情况下运行连接器工作吗?我已准备好将 kafka-connect 连接器插件放在我的所有 VM 实例上。
更新
我们不允许在 kafka-connect 集群上做 put 请求(创建一个新的连接器实例),所以仍然可以使用 kafka-connect 吗?如果是,那么我们是否需要运行自己的 Kafka 并将引导服务器指定为生产 kafka 集群?找不到任何这样做的视频/文章。
【问题讨论】:
标签: apache-kafka apache-kafka-connect confluent-platform