【发布时间】:2011-09-08 19:40:38
【问题描述】:
我在.net找一个工具/api,可以粗略的提取一句话中的关键词。例如,如果我有一篇标题为“PIX:世界上最薄的 15 英寸笔记本电脑,戴尔 XPS 15z”的文章,我想提取关键字,例如DELL、XPS 15z、笔记本电脑等,以便我可以在其他文章中搜索这些关键字并向用户展示类似的文章。
欢迎提出任何建议。
【问题讨论】:
标签: .net search text dictionary keyword
我在.net找一个工具/api,可以粗略的提取一句话中的关键词。例如,如果我有一篇标题为“PIX:世界上最薄的 15 英寸笔记本电脑,戴尔 XPS 15z”的文章,我想提取关键字,例如DELL、XPS 15z、笔记本电脑等,以便我可以在其他文章中搜索这些关键字并向用户展示类似的文章。
欢迎提出任何建议。
【问题讨论】:
标签: .net search text dictionary keyword
如果您想搜索文本并展示相关文章,您可能会对Lucene.NET 感兴趣。它将索引一段文本并接受标准的搜索引擎式查询。它甚至会对搜索结果进行 Google 风格的展示,例如突出显示在文档中找到的搜索词。
这比使用 Tarkus 提到的算法需要更多的工作,但它会解决您的更多问题,并使您不必编写自己的搜索引擎(这是一项不平凡的任务)。
【讨论】:
您还可以在正则表达式中使用分组来提取 Dell 周围的单词。
【讨论】:
我也一直在找这种工具,找到了这个页面http://termcoord.wordpress.com/about/testing-of-term-extraction-tools/free-term-extractors/
您可以从任何工具中进行选择。这对我有很多选择。
【讨论】: