【问题标题】:Is Approximate String Matching / Fuzzy String Searching possible with BigQuery?BigQuery 是否可以进行近似字符串匹配/模糊字符串搜索?
【发布时间】:2014-08-29 08:34:06
【问题描述】:

感谢 Google 提供 BigQuery,非常棒!
BigQuery 是否可以进行近似字符串匹配/模糊字符串搜索?
Google 是否有计划将此功能添加到 BigQuery?

当然,Google 专有的近似字符串匹配算法可用于向 BigQuery 提供此功能,同时仍保留 Google 知识产权。我们搜索了所有 BigQuery 文档和 Stack Overflow 问题。当然有很多算法可以做到这一点,但如何与 BigQuery 集成?

我们的需求很简单,比较两个几乎相同但可能略有不同的字符串。例如:

"Rhodes USA" vs. "Rhodes USA, LLC", vs. "Rhodes USA LLC".  

从我们的 BigQuery 测试看来,两个字符串需要完全匹配,BigQuery 才能加入它们,即使是每个字符串中尾随空格的数量也是如此。非常感谢添加此功能或与 BigQuery 集成的指南。这是为了支持 Milwaukee Jets,这是一家位于威斯康星州密尔沃基的区域性、创新性、部分喷气式飞机所有权公司。再次感谢 Google 提供 BigQuery。

非常感谢您和最诚挚的问候, 安德鲁·保林 (414) 212-5372

【问题讨论】:

    标签: google-bigquery


    【解决方案1】:

    很遗憾,不支持近似字符串匹配。最接近的方法是使用正则表达式。您最好的选择可能是在数据到达 BigQuery 之前对其进行规范化 - 即将“Rhodes USA”和“Rhodes, USA.”转换为相同的字符串。不过,我会为此支持添加一个功能请求错误。

    【讨论】:

      猜你喜欢
      • 2015-11-27
      • 2018-10-06
      • 2014-12-30
      • 1970-01-01
      • 2011-05-11
      • 1970-01-01
      • 1970-01-01
      • 2023-03-23
      • 2013-11-29
      相关资源
      最近更新 更多