【问题标题】:Fuzzy Search on Material Descriptions including numerical sizes & general descriptions of material type材料描述的模糊搜索,包括数字尺寸和材料类型的一般描述
【发布时间】:2010-01-08 16:54:55
【问题描述】:

我们希望提供对电气材料数据库(即导管、电缆等)的模糊搜索。问题是,由于所有材料类型缺乏一致性,我们无法将尺寸从文本描述中拆分为单独的字段,因为有些材料是根据尺寸以外的其他因素进行评级的。

我尝试将全文搜索和 Levenshtein 搜索算法的 SQL CLR 实现结合起来(用于帮助排名),但我的结果有点奇怪(即由于排名不正确,它们没有正确排序) .

例如,如果搜索词是“3/4”ABCD Conduit”,我可能会按以下顺序返回几个不相关的结果:

1/2" 导管 1/4" X 3/4" 电缆 1/4" 电缆扎带 3/4" DFC 导管三通 3/4" ABCD 导管 3/4" 导管

我相信我已经将问题归结为这两种搜索算法没有考虑标点符号和数字的相关性这一事实。也就是说,在这样的搜索中,我希望大小优先于描述其余部分的任何模糊匹配,但我的结果并没有反映这一点。

我的问题是:谁能推荐更好的搜索算法或可能更适合搜索字母数字和标点字符组合的不同方法?

【问题讨论】:

    标签: sql-server algorithm fuzzy-search


    【解决方案1】:

    没关系...我的搜索工作正常,结合全文和 Levenshtein...我发现我将搜索词传递给错误的参数...我的错。

    但是,对于首选的搜索方法,我会听取任何建议...

    【讨论】:

      猜你喜欢
      • 2022-08-18
      • 1970-01-01
      • 2021-06-21
      • 2015-10-14
      • 1970-01-01
      • 2014-08-02
      • 2015-07-12
      • 1970-01-01
      • 2022-07-25
      相关资源
      最近更新 更多