【发布时间】:2016-08-30 11:52:46
【问题描述】:
我已经在 R 中实现了 randomForest 算法,并尝试使用 sparkR(来自 Apache Spark 2.0.0)实现相同的算法。
但我发现 sparkR 中只有线性模型函数,如 glm() 实现 https://www.codementor.io/spark/tutorial/linear-models-apache-spark-1-5-uses-present-limitations
并且无法找到任何 RandomForest(决策树算法)示例。 Spark 的 MLLib 中有 RandomForest,但也无法找到 MLLib 的 R 绑定。
请告诉我,SparkR(2.0.0) 是否支持 RandomForest?否则是否可以将 SparkR 与 MLlib 连接以使用 RandomForest? 如果不是,我们如何使用 SparkR 实现这一目标?
【问题讨论】: