【发布时间】:2020-10-04 09:59:47
【问题描述】:
当我测试时,我的代码如下。
.format("kafka")
.option("kafka.bootstrap.servers","...")
.option("subscribe","...")
.option("startingOffsets", "earliest")
// .option("startingOffsets", "latest")
.load()
但是当我设置 .option("startingOffsets", "latest") 时,恢复总是会从查询停止的地方开始。
如何让.option("startingOffsets", "latest")生效?
ps:我尝试删除检查点文件,但没有成功
【问题讨论】:
-
想详细说明 _“但没用”?究竟是什么不起作用?我不明白这个问题:(
-
@JacekLaskowski 我的意思是,我想删除检查点文件以让结构化流从 latest 读取 kafka 数据,但是当我删除文件时它不起作用。
-
但是有效是因为数据本身有问题
-
“数据本身的问题”是什么?这不是主要问题吗?
标签: apache-spark apache-kafka spark-structured-streaming