【发布时间】:2018-10-12 17:12:33
【问题描述】:
我想将两个列表转换为 pyspark 数据框,其中列表是各自的列。
我试过了
a=[1, 2, 3, 4]
b=[2, 3, 4, 5]
sqlContext.createDataFrame([a, b], schema=['a', 'b']).show()
但我得到了
+---+---+---+---+
| a| b| _3| _4|
+---+---+---+---+
| 1| 2| 3| 4|
| 2| 3| 4| 5|
+---+---+---+---+
我真正想要的是:
+---+---+
| a| b|
+---+---+
| 1| 2|
| 2| 3|
| 3| 4|
| 4| 5|
+---+---+
有没有方便的方法来创建这个结果?
【问题讨论】:
标签: python pyspark apache-spark-sql