NLTK 语料库 Twitter_samples 的持续导入错误答案

【问题标题】：Persistent Import Error for NLTK Corpus Twitter_samplesNLTK 语料库 Twitter_samples 的持续导入错误
【发布时间】：2016-06-14 21:51:46
【问题描述】：

我正在使用此脚本尝试从 nltk 包中导入 twitter_samples for python。我目前在 Anaconda 环境中使用 python 2.7。我正在使用 Spyder 运行代码。

import nltk
nltk.download('twitter_samples')
from nltk.corpus import twitter_samples
print twitter_samples.fileid()

当我运行它时，我得到了这个作为回报：

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Users\Person\Anaconda3\envs\py27\lib\site-packages\spyderlib\widgets\externalshell\sitecustomize.py", line 685, in runfile
    execfile(filename, namespace)
  File "C:\Users\Person\Anaconda3\envs\py27\lib\site-packages\spyderlib\widgets\externalshell\sitecustomize.py", line 71, in execfile
    exec(compile(scripttext, filename, 'exec'), glob, loc)
  File "C:/Users/Ben/Anaconda3/attemptNLTK_download.py", line 9, in <module>
    from nltk.corpus import twitter_samples
ImportError: cannot import name twitter_samples

但是当我导入 movie_reviews 时它工作正常。

from nltk.corpus import movie_reviews

我真的不知道为什么这不起作用。我按照建议在我的系统中为 NLTK_DATA 添加了一个环境变量作为 C:\nltk_data ，但这并没有解决它。它位于默认位置（C:\nltk_data）。

也许有一种方法可以直接“导入”语料库而不使用导入...数据在我的 C 驱动器上，我可以看到它，但我无法通过导入功能访问它。

我正在尝试使用这些数据来训练一个分类器来识别正面/负面的陈述/推文。

【问题讨论】：

标签： python python-2.7 twitter nltk spyder

【解决方案1】：

命令from nltk.corpus import twitter_samples 是正确的，根据NLTK 的twitter HOWTO，因此导入错误的最可能原因是您的nltk 版本已过期。

nltk 的 twitter 包很新；它于 2015 年 9 月与 3.0.5 版本一起添加，但从那时起以各种方式“改进”。现在 nltk 是 3.2 版，~~但是当前的 Anaconda 发行版附带 nltk 3.1。~~ 你有哪一个？你可以通过打印nltk.__version__来查看nltk版本。

要更新到 Anaconda 分发的最新版本，请启动 Anaconda 命令提示符并运行以下命令：

% conda update nltk

Anaconda 在 nltk 发布后的几天内更新到当前版本，所以我希望他们在未来的版本中继续这样做，除非出现一些兼容性问题。

【讨论】：

感谢详细的回复及其背后的原因。你是对的。我有 3.0.3 。但是，conda 安装了 nltk 3.2，它可能只是最近的更新。感谢您的正确诊断。
就在我写完这个答案之后，我发现 NLTK 3.2 已经在同一天发布了！很高兴知道 Anaconda 会在几天内跟踪当前版本。