【发布时间】:2019-12-26 15:39:04
【问题描述】:
我想要什么 - 是将列名映射到键。 例如:
#+-------+----------+
#|key1 |key2 |
#+-------+----------+
#|value1 |value2 |
#|value3 |value4 |
#+-------+----------+
将转化为
#+-------+----------+
#| keys|values |
#+-------+----------+
#|key1 |value1 |
#|key1 |value2 |
#|key2 |value3 |
#|key2 |value4 |
#+-------+----------+
在 HiveQL 中,我可以编写类似于
的内容select distinct key, velue
from xxx
lateral view explode(map(
'key1', key1,
'key2', key2) tab as key, value
但是如何在 pyspark 上编写它。 我可以使用 createtemptable 但我认为这不是最好的解决方案/
【问题讨论】:
标签: python dataframe apache-spark pyspark apache-spark-sql