【问题标题】:RandomForest algorithm in SparkR?SparkR中的随机森林算法?
【发布时间】:2016-08-30 11:52:46
【问题描述】:

我已经在 R 中实现了 randomForest 算法,并尝试使用 sparkR(来自 Apache Spark 2.0.0)实现相同的算法。

但我发现 sparkR 中只有线性模型函数,如 glm() 实现 https://www.codementor.io/spark/tutorial/linear-models-apache-spark-1-5-uses-present-limitations

并且无法找到任何 RandomForest(决策树算法)示例。 Spark 的 MLLib 中有 RandomForest,但也无法找到 MLLib 的 R 绑定。

请告诉我,SparkR(2.0.0) 是否支持 RandomForest?否则是否可以将 SparkR 与 MLlib 连接以使用 RandomForest? 如果不是,我们如何使用 SparkR 实现这一目标?

【问题讨论】:

    标签: r sparkr


    【解决方案1】:

    没错,目前 SparkR 中不提供此功能。 可能的选择是在分布式数据块上构建随机森林,然后再组合你的树。 无论如何,这都是关于随机性的。

    一个好的链接:https://groups.google.com/forum/#!topic/sparkr-dev/3N6LK7k4NB0

    猜你喜欢
    • 2021-07-23
    • 1970-01-01
    • 2015-02-12
    • 2020-03-14
    • 2021-06-01
    • 2016-07-05
    • 2014-10-26
    • 2021-06-12
    • 2016-07-23
    相关资源
    最近更新 更多