【问题标题】:Pyspark converting RowMatrix to DataFrame or RDDPyspark 将 RowMatrix 转换为 DataFrame 或 RDD
【发布时间】:2016-11-17 15:42:10
【问题描述】:

我有一个方形 pyspark RowMatrix,看起来像这样:

>>> row_mat.numRows()
100
>>> row_mat.numCols()
100
>>> row_mat.rows.first()
SparseVector(100, {0: 0.0, 1: 0.0018, 2: 0.1562, 3: 0.0342...})

我想运行pyspark.ml.feature.PCA,但它的fit() 方法只接受DataFrame。有没有办法将此RowMatrix 转换为DataFrame

或者有更好的方法吗?

【问题讨论】:

    标签: python apache-spark pyspark spark-dataframe apache-spark-ml


    【解决方案1】:

    用途:

    row_mat.rows.map(lambda x: (x, )).toDF()
    

    【讨论】:

    • 谢谢!这真的很快,正是我想要的。
    猜你喜欢
    • 1970-01-01
    • 2016-05-29
    • 2021-06-29
    • 2023-03-13
    • 2018-09-14
    • 1970-01-01
    • 2017-11-02
    • 1970-01-01
    • 2020-01-24
    相关资源
    最近更新 更多