【问题标题】:Error after install of tensor flow 1.5 (linux mint 18.3)安装张量流 1.5 (linux mint 18.3) 后出错
【发布时间】:2018-02-26 08:14:25
【问题描述】:

刚刚在 Clevo 笔记本电脑上安装了 tensor flow (gpu enable) 1.5,在带有 nvidia 1060 gpu 的 linux mint 18.3 下运行测试程序 python premade_estimator.py 时出现以下错误代码:

    Traceback (most recent call last):
  File "premade_estimator.py", line 20, in <module>
    import tensorflow as tf
  File "/home/empereur/tensorflow/local/lib/python2.7/site-packages/tensorflow/__init__.py", line 24, in <module>
    from tensorflow.python import *
  File "/home/empereur/tensorflow/local/lib/python2.7/site-packages/tensorflow/python/__init__.py", line 49, in <module>
    from tensorflow.python import pywrap_tensorflow
  File "/home/empereur/tensorflow/local/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow.py", line 74, in <module>
    raise ImportError(msg)
ImportError: Traceback (most recent call last):
  File "/home/empereur/tensorflow/local/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow.py", line 58, in <module>
    from tensorflow.python.pywrap_tensorflow_internal import *
  File "/home/empereur/tensorflow/local/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow_internal.py", line 28, in <module>
    _pywrap_tensorflow_internal = swig_import_helper()
  File "/home/empereur/tensorflow/local/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow_internal.py", line 24, in swig_import_helper
    _mod = imp.load_module('_pywrap_tensorflow_internal', fp, pathname, description)
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory


Failed to load the native TensorFlow runtime.

See https://www.tensorflow.org/install/install_sources#common_installation_problems

for some common reasons and solutions.  Include the entire stack trace
above this error message when asking for help.

我已经安装了 cuda 驱动程序 9.0,如下所示:

nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Sep__1_21:08:03_CDT_2017
Cuda compilation tools, release 9.0, V9.0.176

我查看了论坛,大多数问题是两个版本之间的冲突(不是我的情况)或版本 9.0 的路径未完成(我认为我做到了)

我有点新手,所以非常感谢帮助

如果缺少任何信息,请询问,我会提供信息(但请告诉我,我是新手,所以请告诉我如何使用命令行获取信息)

这里是usr/local/的内容

empereur@empereur-Sky-X4C ~ $ ls /usr/local/ bin cuda
cuda-9.1 games lib sbin src Brother cuda-9.0 etc
包括人分享

这里是 usr/local/cuda/lib64 libaccinj64.so 的内容

empereur@empereur-Sky-X4C ~ $ ls /usr/local/cuda/lib64 libaccinj64.so libcusparse.so.9.1.85 libnppist.so.9.1.85 libaccinj64.so.9.1
libcusparse_static.a libnppist_static.a libaccinj64.so.9.1.85 libnppc.so libnppisu.so libcublas_device.a
libnppc.so.9.1 libnppisu.so.9.1 libcublas.so
libnppc.so.9.1.85 libnppisu.so.9.1.85 libcublas.so.9.1
libnppc_static.a libnppisu_static.a libcublas.so.9.1.128
libnppial.so libnppitc.so libcublas.so.9.1.85
libnppial.so.9.1 libnppitc.so.9.1 libcublas_static.a
libnppial.so.9.1.85 libnppitc.so.9.1.85 libcudadevrt.a
libnppial_static.a libnppitc_static.a libcudart.so
libnppicc.so libnpps.so libcudart.so.9.1
libnppicc.so.9.1 libnpps.so.9.1 libcudart.so.9.1.85
libnppicc.so.9.1.85 libnpps.so.9.1.85 libcudart_static.a
libnppicc_static.a libnpps_static.a libcufft.so
libnppicom.so libnvblas.so libcufft.so.9.1
libnppicom.so.9.1 libnvblas.so.9.1 libcufft.so.9.1.85
libnppicom.so.9.1.85 libnvblas.so.9.1.128 libcufft_static.a
libnppicom_static.a libnvblas.so.9.1.85 libcufftw.so
libnppidei.so libnvgraph.so libcufftw.so.9.1
libnppidei.so.9.1 libnvgraph.so.9.1 libcufftw.so.9.1.85
libnppidei.so.9.1.85 libnvgraph.so.9.1.85 libcufftw_static.a
libnppidei_static.a libnvgraph_static.a libcuinj64.so
libnppif.so libnvrtc-builtins.so libcuinj64.so.9.1
libnppif.so.9.1 libnvrtc-builtins.so.9.1 libcuinj64.so.9.1.85
libnppif.so.9.1.85 libnvrtc-builtins.so.9.1.85 libculibos.a
libnppif_static.a libnvrtc.so libcurand.so libnppig.so libnvrtc.so.9.1 libcurand.so.9.1 libnppig.so.9.1
libnvrtc.so.9.1.85 libcurand.so.9.1.85 libnppig.so.9.1.85
libnvToolsExt.so libcurand_static.a libnppig_static.a
libnvToolsExt.so.1 libcusolver.so libnppim.so
libnvToolsExt.so.1.0.0 libcusolver.so.9.1 libnppim.so.9.1
libOpenCL.so libcusolver.so.9.1.85 libnppim.so.9.1.85
libOpenCL.so.1 libcusolver_static.a libnppim_static.a
libOpenCL.so.1.0 libcusparse.so libnppist.so
libOpenCL.so.1.0.0 libcusparse.so.9.1 libnppist.so.9.1 存根

【问题讨论】:

  • 可能问题是,你没有安装CuDNN,这是一个CUDA的神经网络辅助库。请发布/usr/local//usr/local/cuda/lib64目录的内容。
  • 我在问题的末尾发布了输出。我确实安装了 CuDNN 并运行了测试程序(给出了很长的输出但以 test succefull 结束)我很惊讶地看到我似乎安装了 9.1 到....(我真的以为我没有安装它!)可能是问题?
  • 嗯...我认为在安装 nvidia cuda 工具包时,我没有指定版本(因此它安装 9.1 并将 cuda 9.1 作为依赖项安装...)我目前正在尝试清除 cuda 9.1 ...希望它能工作(不会破坏任何东西!)
  • 您对问题的看法是正确的。但是,您可以将 cuda 符号链接指向 CUDA-9.0,或者将 bashrc 中的 LD_LIBRARY_PATH 更新为指向 CUDA-9.0,而不是清除 9.1
  • 好吧,它现在被清除了,并且 tensorflow 正在工作!不是一个干净的安装(我不能运行 nvcc --version :它告诉我安装 cuda-toolkit (我已经拥有的女巫)所以我想从长远来看我可以期待一些问题,但现在它会做!谢谢大家的建议,真的很感激!

标签: python tensorflow linux-mint


【解决方案1】:

感谢大家的帮助,所以我不小心安装了cuda 9.1(需要9.0)。我这样做了,但没有专门强制 cuda-toolkits 上的版本。通过清除 cuda 9.1 和 nvidia-cuda-toolkit 并重新安装 9.0 版本解决了我的问题(不正确)。按照laylog的建议,可能会以更干净的方式解决它

但不是清除 9.1,您可以将 cuda 符号链接指向 CUDA-9.0 或更新 bashrc 中的 LD_LIBRARY_PATH 以指向 CUDA-9.0

再次感谢大家!

【讨论】:

    猜你喜欢
    • 2018-10-12
    • 1970-01-01
    • 1970-01-01
    • 2017-12-27
    • 2021-07-13
    • 2019-01-05
    • 2018-02-02
    • 1970-01-01
    • 2018-05-01
    相关资源
    最近更新 更多