【发布时间】:2016-06-26 23:08:25
【问题描述】:
谁能解释一下为什么 random_state 参数对模型的影响如此之大?
我有一个 RandomForestClassifier 模型,并且想要设置 random_state(用于可重复性浇注),但根据我使用的值,我的总体评估指标(F1 分数)得到了非常不同的值
例如,我尝试用 100 个不同的 random_state 值拟合同一个模型,在训练广告测试后,最小的 F1 为 0.64516129,最大的为 0.808823529)。这是一个巨大的差异。
这种行为似乎也很难比较两个模型。
想法?
【问题讨论】:
标签: python random machine-learning scikit-learn evaluation