【发布时间】:2016-11-17 15:42:10
【问题描述】:
我有一个方形 pyspark RowMatrix,看起来像这样:
>>> row_mat.numRows()
100
>>> row_mat.numCols()
100
>>> row_mat.rows.first()
SparseVector(100, {0: 0.0, 1: 0.0018, 2: 0.1562, 3: 0.0342...})
我想运行pyspark.ml.feature.PCA,但它的fit() 方法只接受DataFrame。有没有办法将此RowMatrix 转换为DataFrame?
或者有更好的方法吗?
【问题讨论】:
标签: python apache-spark pyspark spark-dataframe apache-spark-ml