【问题标题】:Error while executing randomForest when the number of trees are increased beyond a certain number当树的数量增加到超过一定数量时,执行 randomForest 时出错
【发布时间】:2018-01-05 04:01:05
【问题描述】:

我正在运行 radomForest 模型。该模型运行良好,直到 722 棵树。但是如果我将树的数量增加到 722 以上,我会收到以下错误:

Error message

由于模型运行良好,直到 722 棵树,我想知道这是否可能是内存问题。您认为有什么方法可以验证这一点或找出错误所在吗?

请在下面找到数据集的详细信息: • 文件大小:63MB • 观测数:742,599 • 列数:17(响应变量的所有数字除外)

【问题讨论】:

    标签: r random-forest


    【解决方案1】:

    您正在使用 randomForest 包?,另一种选择是使用 spark.randomForest {SparkR}h2o.randomForest,这些包在大数据中提供了更大的执行能力,在下面link 他们比较了随机森林的算法,观察 1000 万次,最好的选择是 h2o 和 xgboost。

    【讨论】:

    • 感谢您的建议。我会试试看。但我想知道是否有办法确定我收到的这个错误是内存错误?
    • 您可以通过查看 Windows 中的任务管理器来确定这一点。使用的 ram 是否会增加到极限,然后 R 会崩溃?
    • 感谢您的回复。我正在通过 Web 界面使用 RStudio 服务器实例,因此无法检查任务管理器来监控 RAM 性能。
    猜你喜欢
    • 2019-02-14
    • 1970-01-01
    • 2017-12-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-11-30
    • 2017-01-04
    • 1970-01-01
    相关资源
    最近更新 更多