【发布时间】:2017-07-07 05:37:37
【问题描述】:
我想问是否可以在 scikit-learn 中执行“Stratified GroupShuffleSplit”,即GroupShuffleSplit 和StratifiedShuffleSplit 的组合
这是我正在使用的代码示例:
cv=GroupShuffleSplit(n_splits=n_splits,test_size=test_size,\
train_size=train_size,random_state=random_state).split(\
allr_sets_nor[:,:2],allr_labels,groups=allr_groups)
opt=GridSearchCV(SVC(decision_function_shape=dfs,tol=tol),\
param_grid=param_grid,scoring=scoring,n_jobs=n_jobs,cv=cv,verbose=verbose)
opt.fit(allr_sets_nor[:,:2],allr_labels)
这里我申请了GroupShuffleSplit,但我还是想根据allr_labels添加启动
【问题讨论】:
-
StratifiedShuffleSplit 如果需要也有参数组。只需使用 Stratifiedshufflesplit 将 allr_labels 并在适合 GridSearchCV 时将组传递给 fit() 方法
-
不幸的是,它对我不起作用,我认为这个选项是无效的,因为它在文档中说“总是被忽略,为了兼容性而存在。”
标签: python scikit-learn dataset shuffle cross-validation