【发布时间】:2014-01-11 03:05:21
【问题描述】:
我有一个 CUDA 内核,其中全局数组的每个地址由每个线程写入 4 次。似乎一个 warp 中的两个线程可能会同时写入同一个地址,从而导致进程未合并。块中的线程呢?
d_next_front[i*width + j+1] = 1;
d_next[i*width + j-1] = 1;
d_next[(i+1)*width + j] = 1;
d_next[(i-1)*width + j] = 1;
【问题讨论】:
-
我想this回答你的问题