【发布时间】:2018-11-06 15:36:54
【问题描述】:
我有以下情况:我有一个带有“id”和“array”作为架构的数据框。现在我想为每个数组获取具有相应 id 的所有对列表并将其再次保存在数据框中。比如:
这是原始数据框:
+---+----------+
| id|candidates|
+---+----------+
| 1| [2, 3]|
| 2| [3]|
+---+----------+
这就是计算后的样子:
+---+---+
|id1|id2|
+---+---+
| 1| 2|
| 1| 3|
| 2| 3|
+---+---+
也许有人对这个问题有想法?
【问题讨论】:
-
只需使用explode函数
-
我如何将它用于所有数组元素?
标签: scala apache-spark apache-spark-sql