【发布时间】:2019-05-25 20:51:06
【问题描述】:
我有以下数据框
A B
0 France United States of America
1 Italie France
2 United Stats Italy
我正在寻找一个函数,它可以(对于A 列中的每个单词)前 4 个字母,然后在 B 列中搜索这 4 个字母是否存在。现在,如果是这种情况,我想将 A 中的值替换为 B 中的相似值(相似的前 4 个字母)。
示例:A 列中的 Italie 一词,我必须取 Ital,然后在 B 中搜索是否可以找到。然后我想用类似的词Italy替换Italie。
我尝试用str.contains 函数来做for
但仍然不能只取前 4 个字母。
预期输出:
A B
0 France United States of America
1 Italy France
2 United Stats of America Italy
为了总结,我正在寻找更正 A 列中的值,使其与 b 列中的值相似
【问题讨论】:
-
这个需要先模糊匹配再使用map
标签: python string pandas text contains