【发布时间】:2019-09-19 15:45:28
【问题描述】:
我有一个小数据集 (140K),我想将其拆分为验证集、使用目标变量的验证集测试集和另一个字段来区分这些拆分。
【问题讨论】:
-
@pissall 分层样本和分层拆分并不完全相同。但是,这是一个好的开始。谢谢
-
这是一个如何使用
groupby方法进行比例分配的示例。掌握逻辑并帮助您的用例就是一切。
标签: python validation machine-learning pyspark