【发布时间】:2012-06-07 22:36:49
【问题描述】:
有时,我的 CUDA 程序中的错误会导致桌面图形中断(在 Windows 中)。通常情况下,屏幕仍然有些可读性,但当图形发生变化时,例如拖动窗口时,会出现大量半随机彩色像素和小块。
我曾尝试通过更改桌面分辨率来重置 GPU 和驱动程序,但这无济于事。我找到的唯一解决方法是重新启动计算机。
是否有程序或一些技巧可以让驱动程序和 GPU 在不重新启动的情况下重置?
背景:
我有 1.0、1.1、1.3 和 2.0 卡,但我现在只有 1.1 和 2.0 卡。我在 1.0 和 1.1 上看到过这个问题。我很确定我在 1.3 上看到过。我不确定2.0。内存保护是否在 1.3 左右添加了一段时间?我几乎可以肯定这不是由于硬件不稳定,因为问题似乎是由我的代码中的错误触发的,并且在修复错误后消失了。运行完代码后,卡已经稳定了。我在我的 1.1 卡上看到这个问题后写了这个问题,但在我修复了一个错误后它就消失了,现在我没有任何代码可以重现它。也许我应该尝试写入 1.1 卡上的随机位置,看看是否有任何事情发生......
【问题讨论】:
-
您的意思是当您有一个长时间运行的 cuda 程序并且驱动程序崩溃时?
-
@Tudor:不,我不认为将内核因素运行到其中所需的时间。与看门狗定时器无关。
-
这真的不应该发生,所以你应该测试你的电路板是否有硬件问题。首先尝试更换电路板并运行相同的导致错误的程序,看看是否可以重现它(理想情况下是相同型号电路板和不同电路板的实例)。如果它重现,则不太可能是硬件问题。你也可以试试像this 这样的内存检查器(不确定它是否是最新的)。