【发布时间】:2018-01-28 03:09:14
【问题描述】:
我有 2 个数据库,都有公司名称,但格式不同。我已经能够使用vlookup 进行精确匹配。我想提取写法不同但实际上是同一家公司的公司并提取数据。
以下是我拥有的数据库的一小部分
Database 1
Column A
1-800-Flowers.com Inc
Abbott Laboratories (Abbott)
21st Century Fox America Inc (formerly News America Inc)
Column B
1234(data I need to grab)
4567
8910
Database 2
Column C
1-800 CONTACTS INC
1-800-FLOWERS.COM
ABBOTT LABORATORIES
TWENTY-FIRST CENTURY FOX INC
Column D
ABCD(DataI can ignore as the company doesn't exist in database 1)
EFGH (Data I need as it matches from Database 1)
IJK
LMNO
从上面的数据库中可以看出,数据库 1 与数据库 2 的匹配词类似,例如 21 世纪福克斯美国公司与 21 世纪福克斯公司
在我的数据库 1 中,我有大约 4000 多个值,而在数据库 2 中,我有 10,000 个值。是否有代码可以比较两个数据库之间的相似词并从 B 列和 D 列中提取我需要的数据?
我已经尝试过查询,但它并没有按照我想要的方式工作。 This is my shareable link.
目前,我所做的是使用 REEXTRACT 提取相似的单词,以在 21st Century Fox 和 Twenty-First Century Fox 等字符串之间找到匹配项,并尝试使用查询匹配两个数据集。但是,当我这样写时,我的查询结果出现了 NA
=query(E:E,"Select E where E contains '"&L2&"'",0 )
L2 是包含字符串 Century Fox 的单元格
【问题讨论】:
-
您是否对 excel 解决方案感兴趣,或者您是否只是添加了该标签以示好笑?
-
你的代码在哪里?
-
道歉。我拿错了链接。我之前没有得到共享链接。我现在添加了它@SherylHohman
-
@Jeeped 我正在寻找谷歌表格解决方案。我发帖之前没有检查链接,但是链接现在可以使用了
标签: database google-sheets fuzzy-search fuzzy