【发布时间】:2020-05-12 21:59:57
【问题描述】:
我有以下情况: 我有一个以“数组”作为架构的数据框。现在我想为每个数组获取所有对列表并将其再次保存在数据框中。比如:
这是原始数据框:
+---------------+
| candidateList|
+---------------+
| [1, 2]|
| [2, 3, 4]|
| [1, 3, 5]|
|[1, 2, 3, 4, 5]|
|[1, 2, 3, 4, 5]|
+---------------+
这就是计算后的样子:
+---------------+
| candidates |
+---------------+
| [1, 2]|
| [2, 3]|
| [2, 4]|
| [3, 4]|
| [1, 3]|
| [1, 5]|
| [3, 5]|
|and so on... |
+---------------+
我真的不知道这在 spark 中是如何实现的,也许有人给我提示。
亲切的问候
【问题讨论】:
标签: scala apache-spark apache-spark-sql