【问题标题】:RTX 2080 Ti cuda-memcheck hit error at the beginning of creating Cublas contextRTX 2080 Ti cuda-memcheck 在创建 Cublas 上下文时遇到错误
【发布时间】:2019-06-24 10:17:09
【问题描述】:

我在 GTX 1080 Ti 和 RTX 2080 Ti 上运行相同的程序。我发现当我尝试使用Cuda-memcheck工具检查我的程序时,基于设备RTX 2080 Ti,我总是得到以下错误。

========= CUDA-MEMCHECK
========= Program hit cudaErrorInvalidValue (error 11) due to "invalid argument" on CUDA API call to cudaFuncSetAttribute. 
=========     Saved host backtrace up to driver entry point at error
=========     Host Frame:/usr/lib/x86_64-linux-gnu/libcuda.so.1 [0x359363]
=========     Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x79a03c]
=========     Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x72c2ab]
=========     Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x72c610]
=========     Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 (cublasCreate_v2 + 0x1ce7) [0x14b337]
=========     Host Frame:./GPU_LMM (main + 0x43) [0xb633]
=========     Host Frame:/lib/x86_64-linux-gnu/libc.so.6 (__libc_start_main + 0xe7) [0x21b97]
=========     Host Frame:./GPU_LMM (_start + 0x2a) [0xb77a]
=========
========= Program hit cudaErrorInvalidValue (error 11) due to "invalid argument" on CUDA API call to cudaGetLastError. 
=========     Saved host backtrace up to driver entry point at error
=========     Host Frame:/usr/lib/x86_64-linux-gnu/libcuda.so.1 [0x359363]
=========     Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x79deb3]
=========     Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x72c2b8]
=========     Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 [0x72c610]
=========     Host Frame:/usr/local/cuda/lib64/libcublas.so.10.0 (cublasCreate_v2 + 0x1ce7) [0x14b337]

我确保此时我所做的只是创建一个 Cublas 上下文并且什么都不做。我不确定问题是什么。是不是CUDA 10.0和RTX 2080 Ti版本不匹配造成的?

关于我的服务器的信息如下。 NVIDIA-SMI 410.93 驱动版本:410.93 CUDA 版本:10.0

【问题讨论】:

  • 几乎可以肯定,您使用的 cublas 版本不支持该卡
  • @talonmies 关于我的服务器的信息如下。 NVIDIA-SMI 410.93 驱动程序版本:410.93 CUDA 版本:10.0。
  • 您使用 CuBlas 10 吗? RTX卡需要它
  • @DanielBauer 你能告诉我如何检查 CuBlas 版本吗?我只是安装最新版本的 CUDA
  • 这是图灵设备上 CUDA 10 上的一个已知问题,预计将在下一个公共 CUDA 版本中修复。它准确地反映了将被修复的 CUBLAS 行为。问题/行为是良性的,因此在更大范围内可以认为该报告是虚假的。我目前没有更多信息,也无法回复提供更多信息或预期 CUDA 发布日期的请求。

标签: cuda gpu cublas


【解决方案1】:

最新的 CUDA 版本 10.0.130 应该支持 RTX2080 Ti 确保您的驱动程序也是最新的。

在 Linux 上,即驱动程序版本 >= 410.48,在 Windows 上 >= 411.31

CuBlas 在版本 10 中也获得了图灵支持。

【讨论】:

  • nvcc:NVIDIA (R) Cuda 编译器驱动程序版权所有 (c) 2005-2018 NVIDIA Corporation 构建于 Sat_Aug_25_21:08:01_CDT_2018 Cuda 编译工具,版本 10.0,V10.0.130
【解决方案2】:

真正的问题是Cublas库与Cuda 10版本和RTX gpu卡不兼容。

【讨论】:

  • CUDA 10 CUBLAS 与 RTX GPU 兼容。有一个相当小的问题,如果你在cuda-memcheck 下运行它,会标记一个良性错误。发生此错误并不意味着行为或结果值得怀疑。
猜你喜欢
  • 1970-01-01
  • 2020-03-11
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-03-26
  • 2020-11-02
  • 2021-03-28
相关资源
最近更新 更多