【问题标题】:sklearn's KFold function with shuffle and random_statesklearn 的 KFold 函数,带有 shuffle 和 random_state
【发布时间】:2021-06-28 20:26:14
【问题描述】:

我正在尝试了解如何使用交叉验证功能sklearn.model_selection.KFold。如果我定义(比如在这个tutorial

from sklearn.model_selection import KFold

kf = KFold(n_splits=5, shuffle=False, random_state=100)

我明白了

ValueError: Setting a random_state has no effect since shuffle is False.
You should leave random_state to its default (None), or set shuffle=True. 

这个错误是什么意思,为什么需要设置random_state=Noneshuffle=True

【问题讨论】:

    标签: python machine-learning scikit-learn k-fold


    【解决方案1】:

    在这种情况下洗牌意味着数据首先被随机洗牌,然后再分成测试/训练。 random_state 将允许数据混洗的方式是可重复的。没有打开洗牌,random_state 没有任何意义。

    【讨论】:

    • 谢谢,您推荐哪些参考资料来了解有关数据预处理的更多信息?我没有找到有用的 sklearn 文档。
    • 这确实是正确的答案,尽管我承认我很困惑为什么 sklearn 设计者决定在这种情况下抛出错误;可以说,一个警告就足够了。
    猜你喜欢
    • 2019-03-25
    • 1970-01-01
    • 2020-06-14
    • 2017-12-18
    • 2012-08-27
    • 2014-11-23
    • 1970-01-01
    • 2016-02-02
    • 2018-08-14
    相关资源
    最近更新 更多