【发布时间】:2020-02-06 15:14:01
【问题描述】:
我有一个数据集,其中包含公司名称列表以及它们各自的 ID。每家公司都有多个实例,其中一些看起来不同。每个公司名称至少有一个实例具有 ID,但由于拼写不一致,并非所有实例都具有 ID。所有的公司都聚集在一起。数据看起来像这样:
company_name id
T. Rowe Price Group
Group, T. Rowe Price 576
T. ROWE PRICE GROUP
Transatlantic, Inc 458
Transatlantic, Incorporated
Transatlantic, Inc 458
有没有一种很好的方法可以将缺少 ID 的公司名称与正确的名称相匹配?
【问题讨论】:
-
嗨,我知道你是新来的。如果您认为某个答案解决了问题,请单击绿色复选标记将其标记为“已接受”。这有助于将注意力集中在仍然没有答案的旧 SO。
标签: python pandas matching fuzzy