【发布时间】:2019-10-11 18:19:50
【问题描述】:
【问题讨论】:
-
您可能会获得每个类别的 70% .. 像
df.groupby('category').apply(train_test_split, args=0.7, ....)这样您填写正确的参数而不是args等 -
通常,当您执行
df.sample时,它会随机抽取您的训练集。从理论上讲,这将为您提供相同的课程分布。也就是说,你总是可以加倍努力,按照@rafaelc 的建议去做。
标签: python pandas scikit-learn