【发布时间】:2018-08-24 18:24:00
【问题描述】:
当我发现 fit 方法时,我正在尝试对 Sklearn 中的分组数据进行交叉验证
fit(X, y=None, groups=None, **fit_params)
有一个groups参数定义为:
groups : 类似数组,形状为 (n_samples,),可选 将数据集拆分为训练/测试集时使用的样本的分组标签。
这与将我的数据与其他迭代器拆分以获取分组数据(GroupKFold、LeaveOneGroupOut)相同吗?
如果没有,使用分组数据运行 GridSeachCV 的正确方法是什么?
【问题讨论】:
标签: python machine-learning scikit-learn