【问题标题】:How to use multiple imputed data for further analysis in SVM and ANN?如何使用多个估算数据在 SVM 和 ANN 中进行进一步分析?
【发布时间】:2026-01-24 16:00:01
【问题描述】:

我的原始数据包含一些缺失值,我使用多重插补来填充它们。我的下一个目标是在 SVM 和 ANN 中使用这些数据。我原本以为 MI 会给我一个“合并”的完整数据集,但结果证明 MI 只给出了关于估算数据集的合并分析结果。所以我的问题是: 1)有什么方法,像任何方程一样,我可以用来将估算的数据集聚合到一个数据集中并用于进一步分析; 2)如果没有,应该如何使用多个数据集进行我的研究。 谢谢!

【问题讨论】:

    标签: missing-data imputation r-mice


    【解决方案1】:

    这是对 MI 的普遍误解。

    大概的流程应该是这样的:

    1. 多重插补
    2. 对每个估算数据集的分析

    如果您先进行插补,然后将所有插补数据集合并到一个插补数据集,您将失去 MI 的所有好处。那么您可以使用任何其他插补方法。这个想法是执行您的分析,例如 5 次,每个估算数据集执行一次。因为您想说明您的分析在使用不同的估算输入数据集时可能产生的不同结果。之后你汇集/合并你的分析结果。 整个过程在 ML 中并不常见。但在您的情况下,您可以例如在所有 5 个数据集上使用 SVM,然后比较结果/提出合并/组合结果的程序。

    【讨论】:

      最近更新 更多