【发布时间】:2020-08-05 13:25:25
【问题描述】:
我有 2 个数据框: DF1
ID Address
AB1 VILL +PO CHAPAR TAPUKADA ALWAR
AB2 VILL WARD NO 02 THIKARIYA CHAND RAWAT JUNA PADA POST BADANA 0 SIROHI
AB3 RAMKUMAR YADAV VILL KANSL 0 JAIPUR
AB4 VILL KHERKI MUKKER POSTPANIYA PUTLI JAIPUR
还有,df2
Name
CHHAPPAR
CHHAPAR
KANSAL
KANSIL
KANSOL
KHERK
KHERKIA
PAR
UR
WAR
RIYA
DAV
LI
我想在 DF1 字符串中应用模糊逻辑。如果 DF1 中给出的名称与 DF2 匹配,请给我 DF2 名称
输出应该是这样的
ID Address Name
AB1 VILL +PO CHAPAR TAPUKADA ALWAR CHHAPPAR, CHHAPAR
AB2 VILL WARD NO 02 THIKARIYA CHAND RAWAT JUNA PADA POST BADANA 0 SIROHI
AB3 RAMKUMAR YADAV VILL KANSL 0 JAIPUR KANSAL, KANSIL, KANSOL
AB4 VILL KHERKI MUKKER POSTPANIYA PUTLI JAIPUR KHERK, KHERKIA
我尝试应用 FuzzywuzzyR,但报错
我也尝试了 agrep,但它给我的结果是真/假。
请帮我解决这个问题。另外,如果我应该尝试其他包模糊
【问题讨论】:
-
名字总是一个字?
-
似乎有可用的解决方案here。
-
@JBGruber :是的,名字总是1个字。
标签: r fuzzy-logic fuzzywuzzy agrep