【问题标题】:Dimension Reduction with Map reduce, using distributed computing?Map reduce 降维,使用分布式计算?
【发布时间】:2011-03-03 04:25:03
【问题描述】:

你知道大数据降维的应用或算法吗,可能使用Map-Reduce,或者其他api,还有:

  • 你知道一些算法吗? Singular Value decomposition比 可用于减少尺寸 数据集

  • 如何使用分布式计算 解决这个???

【问题讨论】:

    标签: mapreduce distributed-computing


    【解决方案1】:

    看看Mahout,因为在那里实现了SVD。

    【讨论】:

      【解决方案2】:

      除了 Mahout,您还应该看看 SLEPc(这是一个基于 PETSc 的工具包),用于解决非常大的稀疏矩阵的特征值问题。它使用 MPI,因此它将在许多不同的并行和分布式架构上运行。还有Gensim,用 Python 编写。它的可扩展性可能不如 Mahout 或 SLEPc,但更易于使用。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2014-03-07
        • 2014-08-05
        • 2016-08-01
        • 2012-05-06
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多