【发布时间】:2019-12-13 11:13:28
【问题描述】:
如上所述,我目前正在设置一个 Kafka Connect Sink 以将数据从 Kafka 接收到 Google Cloud Storage。
然而,一切进展顺利 - 它只使用最新的可用偏移量。也就是说,一旦它开始运行,它只会将新生成的消息下沉到 GCS,而不是来自 Kafka 的现有消息。我已经尝试删除 kafka 连接存储/偏移主题,创建新的连接器名称等。但是,它总是从最新的偏移开始。
如果无论如何要为 Kafka Connect GCS Sink 配置最早的偏移量?我还没有看到任何配置来处理这个问题
https://docs.confluent.io/current/connect/kafka-connect-gcs/configuration_options.html
或
https://docs.confluent.io/current/connect/references/allconfigs.html
我已尝试删除任何 kafka 连接主题/文件存储,以及从新的连接器名称开始
我看到连接器启动后生成的 Kafka Connect 接收器消息。
我期望/需要消息从最早的可用偏移量下沉,即。如果没有为连接器提交偏移量,则从最早的消息开始
【问题讨论】:
标签: apache-kafka apache-kafka-connect confluent-platform