【发布时间】:2018-04-09 15:05:12
【问题描述】:
我在 pyspark 中有 sparsevector,看起来像这样
SparseVector(5,{1:5,2:3,3:5,4:3,5:2})
如何将其转换为具有两列的 pandas 数据框,看起来像这样
ID VALUE
1 5
2 3
3 5
4 3
5 2
我尝试了 sparsevector.zipWithIndex() 但它不起作用
【问题讨论】:
-
你能用MVCE更新你的问题吗?
标签: apache-spark pyspark