【发布时间】:2017-02-27 09:17:51
【问题描述】:
我有以下数据框
+-----+-----+-----+ .......+-------+
|item1|item2|item3|........| itemN |
+-----+-----+-----+........|-------+
| v1| v2| v3|........| vN----+
| v4| v5| v6|........| v2N---+
+-----+-----+-----+........|-------+
这里 item1 、 item2 和 item3 是列名,表由 1 行 v1,v2,v3 组成。
我想把它变成
colA colB
item1 v1
item2 v2
item3 v3
. .
. .
. .
这里有两列,可以说 colA 和 colB,行如图所示。
如何使用 scala 在 spark 中进行这种转换?
【问题讨论】:
-
可以粘贴您的代码吗?
-
stackoverflow.com/questions/35603689/…。它类似于作为 java 代码提供的答案。由于我是 scala 新手,你能帮我解决这个问题吗?
标签: sql scala apache-spark