【发布时间】:2022-04-06 21:12:06
【问题描述】:
我需要将 Synapse Apache Spark Scala 脚本中的 DataFrame 写入 Azure 事件中心。
如何将具有多列的 DataFrame 转换为具有称为“body”的单列且所有列都为 json 的 DataFrame?
我正在使用 Scala 和 Spark 3
这是我找到的解决方案,其中 toJson 创建了一个名为“值”的列。
df.toJSON.selectExpr("value as body")
谢谢。
【问题讨论】:
-
我无法让该解决方案在 Scala 中运行。也许这些函数只在 python 库中可用。我下面的解决方案有效,但我想避免在 toJSON 和 selectExpr 之间创建额外的 Dataframe
标签: apache-spark azure-eventhub azure-synapse