【发布时间】:2019-06-24 10:17:09
【问题描述】:
我在 GTX 1080 Ti 和 RTX 2080 Ti 上运行相同的程序。我发现当我尝试使用Cuda-memcheck工具检查我的程序时,基于设备RTX 2080 Ti,我总是得到以下错误。
========= CUDA-MEMCHECK
========= Program hit cudaErrorInvalidValue (error 11) due to "invalid argument" on CUDA API call to cudaFuncSetAttribute.
========= Saved host backtrace up to driver entry point at error
========= Host Frame:/usr/lib/x86_64-linux-gnu/libcuda.so.1 [0x359363]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x79a03c]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x72c2ab]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x72c610]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 (cublasCreate_v2 + 0x1ce7) [0x14b337]
========= Host Frame:./GPU_LMM (main + 0x43) [0xb633]
========= Host Frame:/lib/x86_64-linux-gnu/libc.so.6 (__libc_start_main + 0xe7) [0x21b97]
========= Host Frame:./GPU_LMM (_start + 0x2a) [0xb77a]
=========
========= Program hit cudaErrorInvalidValue (error 11) due to "invalid argument" on CUDA API call to cudaGetLastError.
========= Saved host backtrace up to driver entry point at error
========= Host Frame:/usr/lib/x86_64-linux-gnu/libcuda.so.1 [0x359363]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x79deb3]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x72c2b8]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x72c610]
========= Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 (cublasCreate_v2 + 0x1ce7) [0x14b337]
我确保此时我所做的只是创建一个 Cublas 上下文并且什么都不做。我不确定问题是什么。是不是CUDA 10.0和RTX 2080 Ti版本不匹配造成的?
关于我的服务器的信息如下。 NVIDIA-SMI 410.93 驱动版本:410.93 CUDA 版本:10.0
【问题讨论】:
-
几乎可以肯定,您使用的 cublas 版本不支持该卡
-
@talonmies 关于我的服务器的信息如下。 NVIDIA-SMI 410.93 驱动程序版本:410.93 CUDA 版本:10.0。
-
您使用 CuBlas 10 吗? RTX卡需要它
-
@DanielBauer 你能告诉我如何检查 CuBlas 版本吗?我只是安装最新版本的 CUDA
-
这是图灵设备上 CUDA 10 上的一个已知问题,预计将在下一个公共 CUDA 版本中修复。它准确地反映了将被修复的 CUBLAS 行为。问题/行为是良性的,因此在更大范围内可以认为该报告是虚假的。我目前没有更多信息,也无法回复提供更多信息或预期 CUDA 发布日期的请求。