【问题标题】:Prediction error in R in case of new levels for variable在变量的新水平的情况下,R 中的预测误差
【发布时间】:2013-03-06 03:00:35
【问题描述】:

我在 R 中使用 GBM 包进行预测。Traning 在合理的情况下工作得很好 错误率,但是,当想要在包含具有新级别的因子变量的训练集上运行预测时,我得到了以下错误:

gbm1 <- gbm(SalePrice ~., data=bb,distribution="gaussian",n.trees=7000,cv.folds=3,shrinkage=0.001,interaction.depth=4)

    f.predict <- exp(predict.gbm(gbm1,data.frame(bbv),n.trees=7000))
        Error in predict.gbm(gbm1, data.frame(bbv), n.trees = 7000) : 
          New levels for variable <and the name of the levels are listed>

试图搜索错误文本但只找到GBM代码本身;(

欢迎提出任何建议!

【问题讨论】:

  • 错误很明显(即使您在给我们变量名称之前将其剪切,我也不知道为什么),您提供给gbm.predict的新数据有了新的水平.

标签: r regression prediction


【解决方案1】:

我不熟悉 GBM 包,但错误表明当预测数据包含以前未知的级别时,GBM 无法处理从模型进行的预测。其背后的基本原理是,该模型只能说明它所训练的数据类别。在简单线性模型的情况下,您不能期望模型a~ba 依赖于b)来预测涉及新变量 b 的数据,即a~b+c。该模型没有针对b+c 的训练行为,仅针对b

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-10-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-10-26
    • 2014-10-29
    • 1970-01-01
    相关资源
    最近更新 更多