【发布时间】:2012-07-22 21:23:24
【问题描述】:
我正在编写一个客户支持网站,用户可以在其中提交问题。我希望用户根据他的输入(标题和帖子)查看相关问题的列表。这将与本网站的内容非常相似(类似问题)。
我有点卡住了,不知道从哪里开始。有关如何构建此功能的任何指导?
【问题讨论】:
-
到目前为止你尝试过什么?我想你应该给东西打“相似点”,比如字符串的完全匹配100分,每三个匹配的连续单词20分,每两个10分,两个字符串中存在的每个单词5分,等等......有这个想法的东西。
-
@Yorye 我想到了类似的东西,但一篇文章可能有数百个单词,为每个单词运行查询需要很长时间。除非有更有效的方法来做到这一点?
-
也许与霍夫曼树有一些古怪的组合?
-
它应该在输入任何标签之前显示相关帖子,就像在这个网站上一样
-
按顺序排列出现最多的
X顶部单词,并匹配其他帖子的顶部单词,使较小的索引匹配较大的值。如果超过某个阈值,则将其标记为相关。
标签: c# sql-server sql-server-2008-r2