【发布时间】:2018-07-02 08:42:07
【问题描述】:
我的数据由 99% 的目标变量 = 1 和 1% 的目标变量 = '0' 组成。分层是否保证训练测试和测试集在目标变量方面具有相等的数据比率。就像在容器中一样,'1' 和 '0' 的数量相等吗?
请看下面的代码进行说明
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,stratify=y,random_state=42)
【问题讨论】:
标签: python machine-learning scikit-learn oversampling