【发布时间】:2019-12-12 09:47:58
【问题描述】:
我有一个包含 9000 多个数据点的数据框,其中 3 列有近 1000 个(每个)缺失值。我正在尝试制作一个函数来根据其他值的比例来估算它们。我不是在寻找最常用的方法(模式)。在找到缺失值 = 1000(每列)后,我尝试从其他值分配值该特定列中的行根据它们的比例。假设一列的“a”和“b”比例为 50:50 和 4 个缺失值。我将根据比例填充这些缺失值,因此 2a 和 2b。
【问题讨论】:
-
d = data.frame(a, b)中的a是什么 -
看,你没有使用插补。
group_indices基于组创建索引,由于您没有提供任何组,因此假设所有数据都只是一个组。因此,当您使用createDataPartition时,您只是再次选择了所有数据。这里的数据没有变化,table默认不显示NA。
标签: r imputation