【发布时间】:2017-01-11 09:36:35
【问题描述】:
考虑一个简化的数据集(真实的有更多的列和行):
df
tp tf weight
1 FWD RF 78.86166
2 MF LF 81.04566
3 DEF LF 80.70527
4 DEF LF 82.96071
5 DEF RF 78.42544
6 GK LF 79.37686
7 DEF RF 78.79928
8 MF RF NA
9 MF RF 78.93815
10 DEF RF 80.00284
我想用 tp 和 tf 组合的 median 来填充权重中的缺失值
到目前为止我尝试过的是以下(我使用过 dlpyr)
temp <- df %>% group_by(tp,tf) %>% summarise(mvalue = median(weight,na. rm = TRUE))
这给出了温度:
temp
Source: local data frame [6 x 3]
Groups: tp [?]
tp tf mvalue
<fctr> <fctr> <dbl>
1 DEF LF 81.83299
2 DEF RF 78.79928
3 FWD RF 78.86166
4 GK LF 79.37686
5 MF LF 81.04566
6 MF RF 78.93815
现在我无法弄清楚如何用相应的组中位数填充 df 中的缺失值。
在我的简单情况下,只有一个 NA 对应于 tp = MF 和 tf = RF, 抬头看 temp 的中值为 78.93815
我通常如何做到这一点?如果您有比我最初的方法更好的方法,请提出建议。
编辑: 实际的数据框有一个唯一的 Id 变量,如果这有什么不同或有帮助的话。
【问题讨论】: