【问题标题】:Stratified sampling of a DataFrame into N splits without replacement将 DataFrame 分层采样成 N 个拆分,无需替换
【发布时间】:2021-03-19 17:09:55
【问题描述】:

鉴于我有一个数据框 X,我想将其拆分为 N 个数据框,以便每个集合的分布大致相同(即分层)

最好的方法是什么?

【问题讨论】:

标签: pandas scikit-learn


【解决方案1】:

这可以使用scikit-learn 中的StratifiedKFold 来实现,使用X 中的一列作为分层依据。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2022-09-30
    • 2010-09-23
    • 1970-01-01
    • 1970-01-01
    • 2018-02-22
    • 2015-11-21
    • 2012-01-02
    相关资源
    最近更新 更多