【发布时间】:2012-08-27 22:33:11
【问题描述】:
我有一个 Cuda 应用程序;在首先为各种数组分配 cuda 内存后,程序循环执行:将数据传输到 GPU,在 GPU 上处理内核,从 GPU 传回数据。第一个数据集被 GPU 正确处理并返回。此后后续数据集生成错误 9:无效配置。
由于我不取消或重新分配内存,我不相信我的内存不足。我已经对网格和块的尺寸进行了三次检查,这些尺寸都在范围内:(200, 0, 0) 和 (720, 20,0)。
我还应该查看什么来了解无效的配置是什么?
【问题讨论】:
-
我需要更清楚一点:内核调用会产生错误 9(内存副本没有错误)。此外,使用 Nsight 内核永远不会收到调用;显然,如果配置不好,内核调用永远不会被调用。