【问题标题】:Persistent Import Error for NLTK Corpus Twitter_samplesNLTK 语料库 Twitter_samples 的持续导入错误
【发布时间】:2016-06-14 21:51:46
【问题描述】:

我正在使用此脚本尝试从 nltk 包中导入 twitter_samples for python。我目前在 Anaconda 环境中使用 python 2.7。 我正在使用 Spyder 运行代码。

import nltk
nltk.download('twitter_samples')
from nltk.corpus import twitter_samples
print twitter_samples.fileid()

当我运行它时,我得到了这个作为回报:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Users\Person\Anaconda3\envs\py27\lib\site-packages\spyderlib\widgets\externalshell\sitecustomize.py", line 685, in runfile
    execfile(filename, namespace)
  File "C:\Users\Person\Anaconda3\envs\py27\lib\site-packages\spyderlib\widgets\externalshell\sitecustomize.py", line 71, in execfile
    exec(compile(scripttext, filename, 'exec'), glob, loc)
  File "C:/Users/Ben/Anaconda3/attemptNLTK_download.py", line 9, in <module>
    from nltk.corpus import twitter_samples
ImportError: cannot import name twitter_samples

但是当我导入 movie_reviews 时它工作正常。

from nltk.corpus import movie_reviews

我真的不知道为什么这不起作用。我按照建议在我的系统中为 NLTK_DATA 添加了一个环境变量作为 C:\nltk_data ,但这并没有解决它。它位于默认位置(C:\nltk_data)。

也许有一种方法可以直接“导入”语料库而不使用导入...数据在我的 C 驱动器上,我可以看到它,但我无法通过导入功能访问它。

我正在尝试使用这些数据来训练一个分类器来识别正面/负面的陈述/推文。

【问题讨论】:

    标签: python python-2.7 twitter nltk spyder


    【解决方案1】:

    命令from nltk.corpus import twitter_samples 是正确的,根据NLTK 的twitter HOWTO,因此导入错误的最可能原因是您的nltk 版本已过期。

    nltk 的 twitter 包很新;它于 2015 年 9 月与 3.0.5 版本一起添加,但从那时起以各种方式“改进”。现在 nltk 是 3.2 版,但是当前的 Anaconda 发行版附带 nltk 3.1。 你有哪一个?你可以通过打印nltk.__version__来查看nltk版本。

    要更新到 Anaconda 分发的最新版本,请启动 Anaconda 命令提示符并运行以下命令:

    % conda update nltk
    

    Anaconda 在 nltk 发布后的几天内更新到当前版本,所以我希望他们在未来的版本中继续这样做,除非出现一些兼容性问题。

    【讨论】:

    • 感谢详细的回复及其背后的原因。你是对的。我有 3.0.3 。但是,conda 安装了 nltk 3.2,它可能只是最近的更新。感谢您的正确诊断。
    • 就在我写完这个答案之后,我发现 NLTK 3.2 已经在同一天发布了!很高兴知道 Anaconda 会在几天内跟踪当前版本。
    猜你喜欢
    • 1970-01-01
    • 2014-11-23
    • 1970-01-01
    • 2017-05-27
    • 2017-07-26
    • 1970-01-01
    • 1970-01-01
    • 2014-12-02
    • 2022-01-21
    相关资源
    最近更新 更多