【发布时间】:2014-11-21 16:41:15
【问题描述】:
我正在创建一个程序,它需要查找给定单词的同义词。我试过 Nltk 模块 - Nltk.corpus.wordnet 但这太慢了。因为这是网络版。所以我试图找到一种离线使用它的方法——下载它的数据。
我试过这种Link to StackOverflow的方式,从this link下载WordNet-2.1.exe,但它只安装了这个程序:Remove Duplicate Lines & Words In Multiple Text Files Software。
所以我尝试在该页面上下载WordNet 3.1 DATABASE FILES ONLY,但它包含一些对我没有帮助的文件(也许我不知道如何)。
谁能给我一个建议如何使 WordNet 离线工作(我需要的唯一库是同义词)? 是否可以使其作为 Python 模块或某些 csv 文件工作?
【问题讨论】:
-
可以对非公开使用的语料库(某些工具除外)进行混淆处理。语料库是否可供公众使用?另外,我不确定“未知文件”是什么意思。
-
@keyser 我不知道如何使用它们。我已经编辑了这个问题。它应该是供公众使用的,据我所知我可以使用它,但我必须使用引用。我想在我的学士论文中使用它。
-
我会将 wordnet 作为字典腌制以加快速度,或者使用 BigHugeLabs 之类的 api 在腌制字典中获取和存储同义词。
标签: python nlp nltk offline wordnet