【发布时间】:2020-03-18 17:03:25
【问题描述】:
分层抽样很古老,而且非常重要。
在 h2o.ai 的 r 接口中,他们有一种方法来拆分帧“h2o.splitframe”。有没有办法沿着另一列的不同元素进行分层拆分?
以下是在 h2o 中不这样做的 R 包:
【问题讨论】:
标签: h2o subsampling
分层抽样很古老,而且非常重要。
在 h2o.ai 的 r 接口中,他们有一种方法来拆分帧“h2o.splitframe”。有没有办法沿着另一列的不同元素进行分层拆分?
以下是在 h2o 中不这样做的 R 包:
【问题讨论】:
标签: h2o subsampling
您不需要在模型训练之前应用分层抽样,因为 h2o.ai 提供了不同类型的 fold_assigment 参数,包括“分层”。它在训练期间应用“分层”采样,因此您只需要设置 fold_assingment 和 fold_column 参数。 您可以在下面的链接中找到详细信息。 http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/fold_assignment.html?highlight=stratified#example
【讨论】: