【问题标题】:WordNet in offline mode - Python离线模式下的 WordNet - Python
【发布时间】:2014-11-21 16:41:15
【问题描述】:

我正在创建一个程序,它需要查找给定单词的同义词。我试过 Nltk 模块 - Nltk.corpus.wordnet 但这太慢了。因为这是网络版。所以我试图找到一种离线使用它的方法——下载它的数据。

我试过这种Link to StackOverflow的方式,从this link下载WordNet-2.1.exe,但它只安装了这个程序:Remove Duplicate Lines & Words In Multiple Text Files Software

所以我尝试在该页面上下载WordNet 3.1 DATABASE FILES ONLY,但它包含一些对我没有帮助的文件(也许我不知道如何)。

谁能给我一个建议如何使 WordNet 离线工作(我需要的唯一库是同义词)? 是否可以使其作为 Python 模块或某些 csv 文件工作?

【问题讨论】:

  • 可以对非公开使用的语料库(某些工具除外)进行混淆处理。语料库是否可供公众使用?另外,我不确定“未知文件”是什么意思。
  • @keyser 我不知道如何使用它们。我已经编辑了这个问题。它应该是供公众使用的,据我所知我可以使用它,但我必须使用引用。我想在我的学士论文中使用它。
  • 我会将 wordnet 作为字典腌制以加快速度,或者使用 BigHugeLabs 之类的 api 在腌制字典中获取和存储同义词。

标签: python nlp nltk offline wordnet


【解决方案1】:

看章节:for-application-developer 您可以在那里找到离线文件的格式和 C API 文档链接: API`

【讨论】:

  • 两个链接都坏了
猜你喜欢
  • 1970-01-01
  • 2021-03-01
  • 2019-10-24
  • 1970-01-01
  • 1970-01-01
  • 2014-03-02
  • 2015-07-07
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多