【发布时间】:2017-11-13 12:34:14
【问题描述】:
经过一些处理我有一个 DStream[String , ArrayList[String]] ,所以当我使用 saveAsTextFile 将它写入 hdfs 并且在每批之后它会覆盖数据,所以如何通过附加到以前的结果来写入新结果
output.foreachRDD(r => {
r.saveAsTextFile(path)
})
编辑 :: 如果有人可以帮助我将输出转换为 avro 格式,然后通过附加写入 HDFS
【问题讨论】:
标签: apache-kafka spark-streaming