【发布时间】:2017-04-02 11:54:56
【问题描述】:
这是一个相当广泛的问题,我不是在寻找具体的实现(好吧,如果已经存在解决这个问题的东西,那就太棒了)。如果有人能告诉我如何检索所请求的信息,那将是完美的。
让我用一个例子来描述这个问题。我有一个大学的名字(例如牛津大学)。我将过滤推特以找到提到这所大学的推特。显然,它们中的大多数不会直接包含“Oxford university”,而是可能会使用“Oxon”、“Oxf”或仅包含“Oxford”之类的词。
我的问题是如何自动找到一个单词的所有同义词(更准确地说 - 我只对大学的名称感兴趣)。
【问题讨论】:
-
我猜你不是在寻找同义词,而是人们在 twitter 中使用的单词的所有变体,对吗?如果你想要同义词,你可以使用 WordNet 之类的字典来查找同义词、反义词等等!
标签: web-crawler information-retrieval