【问题标题】:Kernel update breaks CUDA内核更新破坏了 CUDA
【发布时间】:2016-04-06 20:07:54
【问题描述】:

我有一个 NVIDIA Grid K2 GPU 分配给运行 Ubuntu 14.04 的虚拟服务器。为了在自动内核更新后重新安装正确的驱动程序,我运行了sudo apt-get update,然后运行了sudo apt-get install nvidia-current

现在我不能再让 CUDA 7.5 工作了。如果我运行 deviceQuery 示例,我会收到以下消息:

CUDA Device Query (Runtime API) version (CUDART static linking)

cudaGetDeviceCount returned 35
-> CUDA driver version is insufficient for CUDA runtime version
Result = FAIL

这是sudo lshw -c video的输出

PCI (sysfs)

  *-display
       description: VGA compatible controller
       product: SVGA II Adapter
       vendor: VMware
       physical id: f
       bus info: pci@0000:00:0f.0
       version: 00
       width: 32 bits
       clock: 33MHz
       capabilities: vga_controller bus_master cap_list rom
       configuration: driver=vmwgfx latency=64
       resources: irq:16 ioport:1070(size=16) memory:ec000000-efffffff memory:fe000000-fe7fffff memory:c0300000-c0307fff
  *-display
       description: VGA compatible controller
       product: GK104GL [GRID K2]
       vendor: NVIDIA Corporation
       physical id: 0
       bus info: pci@0000:0b:00.0
       version: a1
       width: 64 bits
       clock: 33MHz
       capabilities: pm msi pciexpress vga_controller bus_master cap_list
       configuration: driver=nvidia latency=64
       resources: irq:19 memory:fc000000-fcffffff memory:e0000000-e7ffffff memory:e8000000-e9ffffff ioport:5000(size=128)

【问题讨论】:

  • nvidia-current 几乎肯定不是要使用的正确包。按照clean out old package manager installations 的步骤操作(即“使用以下命令卸载 RPM/Deb 安装”)。请务必清除所有由nvidia-current 安装的软件包以及之前安装的 CUDA 和驱动程序中的任何软件包。然后关注the steps to (re)install CUDA 7.5
  • 顺便说一句,我假设您之前的(原始?)CUDA 7.5 安装是通过包管理器方法完成的。如果它实际上是通过运行文件安装程序方法完成的,那么恢复步骤会有些不同。但我建议您参考安装指南的same section
  • 这个问题与 StackOverflow 定义的编程无关。在相关网站上可能更合适,askubuntu.comunix.stackexchange.com。考虑使用 Q 底部的标志链接并要求版主移动它。请不要在 2 个不同的网站上发布相同的 Q。谢谢,祝你好运。
  • 谢谢@RobertCrovella - 效果很好!
  • @felbo 你为什么不添加一个答案来解释你做了什么。我会投票。然后我们可以将这个问题从未回答的列表中删除。如果它碰巧关闭了,那就这样吧。

标签: linux ubuntu cuda gpu nvidia


【解决方案1】:

我使用来自installation guide 的提示通过以下步骤解决了这个问题:

  1. 卸载了我通过运行sudo apt-get --purge remove nvidia-current 错误安装的软件包。

  2. 使用命令sudo /usr/local/cuda-7.5/bin/uninstall_cuda_7.5.pl卸载CUDA 7.5

  3. 使用sudo reboot重新启动服务器

  4. 通过运行 the downloadable .run file 并按照说明安装 CUDA 7.5。

  5. 通过运行 deviceQuery CUDA 示例检查一切是否正常。

【讨论】:

    猜你喜欢
    • 2018-10-23
    • 2016-02-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-01-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多