【发布时间】:2021-08-01 03:55:13
【问题描述】:
我有两个 df,每个来自不同的来源。它们都引用了相同的信息,但其中有一个我感兴趣的附加列。
head(df1)
DISTRICT_NAMES
<chr>
1 HUANUCO
2 SAN MARTIN DE PORRES
3 ANCON
4 RIMAC
5 JESUS MARIA
6 VILLA MARIA DEL TRIUNFO
#df1 have 1690 obs.
head(df2)
UBIGEO DISTRICT_NAMES POP
<dbl> <chr> <dbl>
1 10101 HUÁNUCO 32589
2 10102 SAN-MARTIN-DE-PORRES 262
3 10103 ANCÓN 1136
4 10104 RÍMAC 642
5 10105 JESÚS-MARÍA 585
6 10106 VILLA MARÍA DEL TF 1781
#df2 have 1874 obs.
如您所见,'DISTRICT_NAMES' 列在两个 df 中具有相似的值,但并不完全相同。由于目前的数据框,我无法通过merge 函数合并它们,这是我的最终意图。
我的问题是是否有办法告诉 R:“如果一行的值在 7 个字母中的 3 个与另一行匹配,则假设它们相同并继续合并”。
【问题讨论】: