【发布时间】:2012-08-18 09:54:18
【问题描述】:
在我的内核中,如果满足条件,我会更新输出缓冲区的一项
if (condition(input[i])) //?
output[i] = 1;
否则输出可能保持不变,值为 0。
更新的密度非常不可预测,具体取决于输入。此外,哪个输出位置将被更新也是未知的。 (在某些情况下,我可能会强迫他们)
我的问题是,是写所有项目更好,实现合并,还是选择性地写?
output[i] = condition(input[i]); //?
您介意讨论一下您的陈述吗?
【问题讨论】:
标签: memory if-statement cuda store coalescing