【问题标题】:How google recognises 2 words without spaces?谷歌如何识别没有空格的 2 个单词?
【发布时间】:2012-07-13 08:00:31
【问题描述】:

我想了解谷歌如何处理两个单词之间的空格。例如有 2 个单词 - word1 和 word2。我在搜索框中写“word1word2”,它说你的意思是“word1 word2”还是只是理解寻找“word1 word2”。任何信息他们使用什么数据结构和算法?我看到这个答案How to split text without spaces into list of words?,建议使用trie数据结构。

【问题讨论】:

标签: algorithm search nlp


【解决方案1】:

在拼写校正器的候选生成中,您允许省略空格,就像您允许省略其他字母一样....也许看看这里的拼写校正讲座:http://nlp-class.org/ [对不起,自我-promotion] 或 Peter Norvig 的介绍:http://norvig.com/spell-correct.html

【讨论】:

    【解决方案2】:

    我假设你必须有一个脚本(例如使用 ajax http://net.tutsplus.com/tutorials/javascript-ajax/adding-a-jquery-auto-complete-to-your-google-custom-search-engine/

    基本上你检查字典中的单词。空格不能作为检查单词的条件,而只是一种可能性。例如,一个简单的算法(真的很简单)是:“severalwords”你检查了 3 个第一个字母,什么都没有?然后你检查 4 个第一...

    以下是关于谷歌搜索引擎的一些解释: https://developers.google.com/search-appliance/documentation/60/admin_searchexp/ce_improving_search

    也许这里也有帮助: http://tm.durusau.net/?cat=1106

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-03-19
      • 1970-01-01
      • 2021-10-14
      • 2017-02-19
      • 1970-01-01
      相关资源
      最近更新 更多