【发布时间】:2019-08-23 15:52:51
【问题描述】:
我有一个第一列中缺少值的表。 第一列和第二列之间存在关系,即, 第一列有一个唯一的 NAME,对应于第二列中的许多 ID。
例如:
- A 有 (ID1, ID2, ID3)
- B 有 (ID4)
- C 有 (ID5, ID6)
NAME 列中的 NA 需要替换为其列中的现有值之一(A 或 B 或 C)。选择是通过第二列中的 ID 完成的。
例如,第一个 NA 有 ID3。查表,ID3对应A,所以将NA替换为A。
第三列在这一步没有任何作用,但我在接下来的操作中也需要它。
这是它目前的外观:
NAME | ID | Value
A | ID1 | V1
A | ID2 | V2
A | ID3 | V3
B | ID4 | V4
C | ID5 | V5
C | ID6 | V6
NA | ID3 | V7
NA | ID1 | V8
NA | ID5 | V9
NA | ID4 | V10
NA | ID5 | V11
应该是这样的
Name | ID | Value
A | ID1 | V1
A | ID2 | V2
A | ID3 | V3
B | ID4 | V4
C | ID5 | V5
C | ID6 | V6
A | ID3 | V7
A | ID1 | V8
C | ID5 | V9
B | ID4 | V10
C | ID5 | V11
我在 dplyr 和数据表的不同方法之间陷入困境,无法取得任何进展。 知道如何继续前进吗? 谢谢。
【问题讨论】:
标签: r