【问题标题】:pip installation of gensim - 'ascii' codec can't decode byte 0xe2 in position 53gensim 的 pip 安装 - “ascii”编解码器无法解码位置 53 中的字节 0xe2
【发布时间】:2025-12-21 22:05:17
【问题描述】:

我正在尝试在我的虚拟机上使用 pip 安装 gensim。但是,我得到了错误:

Command /usr/bin/python -c "import setuptools, tokenize;__file__='/tmp/pip_build_root/scipy/setup.py';exec(compile(getattr(tokenize, 'open', open)(__file__).read().replace('\r\n', '\n'), __file__, 'exec'))" install --record /tmp/pip-jM6uSL-record/install-record.txt --single-version-externally-managed --compile failed with error code 1 in /tmp/pip_build_root/scipy
Traceback (most recent call last):
  File "/usr/local/bin/pip", line 11, in <module>
    sys.exit(main())
  File "/usr/local/lib/python2.7/dist-packages/pip/__init__.py", line 185, in main
    return command.main(cmd_args)
  File "/usr/local/lib/python2.7/dist-packages/pip/basecommand.py", line 161, in main
    text = '\n'.join(complete_log)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 53: ordinal not in range(128)

我确实在 SO 上寻找过类似的问题,并发现 `pip install pandas` gives UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 41: ordinal not in range(128) 是最接近的问题。但是,我确实尝试将 pip 更新到最新版本。

pip 版本详情

pip 1.5.6 from /usr/local/lib/python2.7/dist-packages (python 2.7)

对此有什么想法吗?

【问题讨论】:

    标签: python python-2.7 pip


    【解决方案1】:

    我解决了,原来是内存问题。这是一个很好的关于交换内存的教程,很有用 - https://www.digitalocean.com/community/tutorials/how-to-add-swap-on-ubuntu-14-04

    【讨论】:

      【解决方案2】:

      我也遇到了同样的问题,求解答here

      只是

      导出 LC_ALL=C

      解决了我的问题

      【讨论】:

      • 如果您使用 ansible 安装 gensim,请将语言环境设置为 ansible.cfg:例如使用 module_lang = en_US.UTF-8 (documentation)
      【解决方案3】:

      我的 ubuntu 15.10 也有同样的问题。 最后,我通过从pypi下载包并手动安装解决了它

      python setup.py install
      

      然后我安装成功,现在运行良好。

      【讨论】: