【发布时间】:2013-06-03 21:49:28
【问题描述】:
我正在为 OpenCL 使用原子操作。相同的代码适用于英特尔 CPU,但在 Nvidia GPU 上出错。我已经为 32 位和 64 位启用了 Atomics。
int cidx=idx%10;
int i=1;
C[idx]=In1[idx] & In2[idx];
atomic_add(R,i);
这只是整个代码的一部分。它在 Nvidia Quadro GPU 上运行时出现构建错误“不支持的操作”,而在 Intel i3、Xeon 和 AMD 处理器上运行良好。
【问题讨论】:
-
R 是 volatile 还是本地或全局工作空间中的整数指针?
标签: parallel-processing opencl