【发布时间】:2015-06-18 22:18:15
【问题描述】:
我有一个表,其中有一些缺失的数据,我想根据某些条件用其他一些相关数据的平均值替换这些数据。我有一些玩具数据来显示以下问题:
var1 var2 var3
123.1 2.1 113
166.5 2.1 113
200.3 2.1 112
NA 2.1 113
NA 2.1 NA
212.1 3.3 112
... ... ...
我想要做的是能够用va1 的平均值填充var1 的NA 值,如果它们都具有相同的var2 和var3。
即,对于 var1 列中的第一个 NA,这将在 var2 和 var3 上与第一个和第二个条目匹配,因此这将获得 (123.1 + 166.5) / 2 的值。
var1 列中的第二个 NA 缺少 var3 信息,因此将给出所有其他 var1 值的平均值,其中 var2 = 2.1.
我对 R 比较陌生,我似乎无法正确理解条件逻辑 - 在此先感谢!
【问题讨论】:
标签: r data-cleaning