【发布时间】:2021-04-13 06:43:10
【问题描述】:
我有一个这样的 df
val df2 = spark.createDataFrame(
Seq(
(0, "this is a sentence"),
(1, "And another sentence")
)
).toDF("num", "words")
我想在此列中获得不同的单词,例如
val vocab = List("this", "is", "a", "sentence", "And", "another")
实现此目的的 scala/spark 式方法是什么?
PS 我知道我可以使用 for 循环等来解决这个问题,但我正在努力在函数式编程方面做得更好,更具体地说是 spark 和 scala。
【问题讨论】:
标签: scala apache-spark