【发布时间】:2021-10-18 12:22:03
【问题描述】:
我正在使用 gridsearchCV 来确定模型超参数:
pipe = Pipeline(steps=[(self.FE, FE_algorithm), (self.CA, Class_algorithm)])
param_grid = {**FE_grid, **CA_grid}
scorer = make_scorer(f1_score, average='macro')
search = GridSearchCV(pipe, param_grid, cv=ShuffleSplit(test_size=0.20, n_splits=5,random_state=0), n_jobs=-1,
verbose=3, scoring=scorer)
search.fit(self.data_input, self.data_output)
但是,我相信我遇到了一些过度拟合的问题: results
我想对每个参数组合下的数据进行洗牌,有什么办法吗?目前,通过 k 折交叉验证,正在为每个参数组合评估相同的验证数据集k-fold,因此过度拟合正在成为一个问题。
【问题讨论】:
标签: scikit-learn shuffle gridsearchcv overfitting-underfitting