【问题标题】:fuzzy matching in sqlsql中的模糊匹配
【发布时间】:2018-08-11 19:05:12
【问题描述】:

给定两个包含客户信息的表格。一个是销售数据,另一个是丰富的映射。客户姓名字段出现在两个表中,也是居住国家和居住城市。后两者是干净的数据。

不幸的是,客户名称很接近,但有时略有不同。 (例如:维也纳大学 vs 维也纳科技大学)。

我的目标是加入表格,并使用丰富映射表信息丰富销售表。

因此我想在 mssql 中设置一个模糊匹配,其中我想用于连接的两列不一定 100% 匹配。 从技术上讲,我知道这个主题可以在 R 中使用模糊连接包来涵盖,但我更愿意将它保留在 mssql 中。

请问有没有办法呢?

【问题讨论】:

    标签: sql sql-server match fuzzy


    【解决方案1】:

    有很多方法可以做到这一点。一种可能会让您接近的方法是内置的 SOUNDEX 功能。如果这不起作用,您可以尝试类似:姓氏的前四个字母 + 姓氏的前两个字母。

    【讨论】:

      【解决方案2】:

      对此没有简单的答案,并且有一些算法可用,可能需要开发 CLR 函数。 question 中有一个很好的讨论,它的答案。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2021-10-05
        • 2014-10-15
        • 1970-01-01
        • 2018-04-26
        • 2011-01-18
        • 2015-04-26
        • 1970-01-01
        • 2010-10-29
        相关资源
        最近更新 更多