【发布时间】:2021-12-02 22:41:27
【问题描述】:
我正在输出readStreamformat("rate"),我想获取dataframe 的开箱即用值字段的格式。我在文档中找到的唯一选项是truncate,但我找不到如何强制获得类似的东西
Batch: 3
-------------------------------------------
+-----------------------+---------+
|timestamp:String |value:Int|
+-----------------------+---------+
|2021-10-14 14:28:58.981|0 |
+-----------------------+---------+
而不是那个
Batch: 3
-------------------------------------------
+-----------------------+-----+
|timestamp |value|
+-----------------------+-----+
|2021-10-14 14:28:58.981|0 |
+-----------------------+-----+
输出代码为:
df
.writeStream
.format("console")
.option("truncate", "false")
.start().awaitTermination(20000)
【问题讨论】:
-
不要认为spark的api中有这个功能。也就是说,您可以通过从
dataframe.schema获取架构,然后使用select和as以及架构和列名来实现此目的。
标签: scala apache-spark apache-spark-sql spark-streaming