【发布时间】:2019-02-14 08:11:05
【问题描述】:
我正在尝试从 kafka 读取流,其中的值是一串逗号分隔值(表示数据集中的列) 目标是读取两个这样的流并加入它们。
如果我从文件中读取,有一种方法可以通过为输入流分配分隔符和模式来做到这一点。这是我能做的:
val stearm_L: DataFrame = spark.readStream
.option("sep", ";")
.schema(schema_L)
.csv("inputFileSteam_L")
如果我从 kafka 而不是文件中读取,我该怎么做?
【问题讨论】:
标签: scala csv apache-kafka spark-streaming spark-structured-streaming