【发布时间】:2018-11-21 05:22:11
【问题描述】:
我训练了一个 GBM 模型(分类)并使用以下方法保存它:
saveRDS(gbmfit, file='E:/..../gbm_nb.rds')
当我使用上述模型对数据进行评分时,我使用以下方法加载它:
gbmfit <- readRDS('E:/..../gbm_nb.rds')
并预测:
nb_lapse$PRED <- predict(gbmfit, nb_lapse, type='response', n.trees=2000)
每次我针对相同的评分数据运行它时,这个 PRED 值应该是相同的。但是其中一些值是不同的。我已经通过上述代码的两次运行打印了这些,差异大约是 3% 的记录。我这样打印的区别:
其中 ID 是唯一编号。 PRD_ORIG 在第一次运行中出现,PRED_NEW 在第二次运行中出现。在第二次运行中,我再次加载模型。如果我没有加载模型,而是在已加载的模型上再次对数据进行评分,那么我看不到 PRED 值有任何差异。
你见过这种行为吗?我期望每次加载模型并对其进行评分时,对于相同的评分数据,这应该给出相同的 PRED 值。
谢谢。
【问题讨论】: