【发布时间】:2012-01-07 00:54:41
【问题描述】:
是
class sklearn.cross_validation.ShuffleSplit(
n,
n_iterations=10,
test_fraction=0.10000000000000001,
indices=True,
random_state=None
)
scikit-learn 中 10*10fold CV 的正确方法? (通过将 random_state 更改为 10 个不同的数字)
因为我在Stratified K-Fold 或K-Fold 中没有找到任何random_state 参数,而与K-Fold 分开的参数对于相同的数据总是相同的。
如果ShuffleSplit 是对的,一个问题是它被提及了
注意:与其他交叉验证策略相反,随机拆分不会 保证所有折叠都会不同,尽管这仍然是 很可能用于大型数据集
10*10 倍 CV 总是这样吗?
【问题讨论】:
标签: python machine-learning scikits scikit-learn