【发布时间】:2018-03-09 05:56:44
【问题描述】:
我有一个数据框df,其结构如下:
+-----+-----+-----+-------+
| s |col_1|col_2|col_...|
+-----+-----+-----+-------+
| f1 | 0.0| 0.6| ... |
| f2 | 0.6| 0.7| ... |
| f3 | 0.5| 0.9| ... |
| ...| ...| ...| ... |
我想计算这个数据帧的转置,所以它看起来像
+-------+-----+-----+-------+------+
| s | f1 | f2 | f3 | ...|
+-------+-----+-----+-------+------+
|col_1 | 0.0| 0.6| 0.5 | ...|
|col_2 | 0.6| 0.7| 0.9 | ...|
|col_...| ...| ...| ... | ...|
我绑定了这两个解决方案,但它返回数据框没有指定使用的方法:
方法一:
for x in df.columns:
df = df.pivot(x)
方法二:
df = sc.parallelize([ (k,) + tuple(v[0:]) for k,v in df.items()]).toDF()
我该如何解决这个问题。
【问题讨论】:
标签: python apache-spark dataframe pyspark transpose