【发布时间】:2014-07-28 19:46:03
【问题描述】:
我是 R 初学者。 我有两个巨大的数据框,我想在 hkdata.2 添加一个名为 Vaccine 的新列,该数据是根据 hkdata.2 上的 2 个参考列(hhID 和成员)从另一个 DF 依从性中获取的,有人可以帮我吗?
hkdata.2
hhID member T0 delta X_hh X_fm ILI age
1 1 7 0 0 0 0 44
1 2 7 0 0 0 0 36
2 1 8 0 1 0 0 39
2 2 8 0 1 0 0 39
adherence
hhID member mask soap vaccine
1 0 1 0 1
1 1 1 1 1
1 2 0 0 1
2 0 1 0 0
2 1 0 0 0
2 2 1 0 1
所以最后我可以得到这样的东西。 在 hkdata.2 中有一个称为疫苗的额外列
hkdata.2
hhID member T0 delta X_hh X_fm ILI age vaccine
1 1 7 0 0 0 0 44 1
1 2 7 0 0 0 0 36 1
2 1 8 0 1 0 0 39 0
2 2 8 0 1 0 0 39 1
【问题讨论】:
-
请检查 ?merge(), ?rbind_list from dplyr。这里,
hhID、member列在两个数据集中都不是唯一的。 -
所以在同一个hhID下,只有1个唯一#的成员