【发布时间】:2011-09-01 13:40:56
【问题描述】:
我尝试将一些数据从共享内存传输到全局内存。一些连续的线程将访问一个银行(但不是相同的 32 位)。所以存在一些银行冲突。 (我使用 Visual Profiler 进行检查) 但是,这些数据也会被合并,然后被传输到全局内存。 (我使用 Visual Profiler 进行检查) 为什么数据会以合并的方式写入全局内存?在我看来,流式多处理器会一个一个地弹出 32 位字(基于银行的带宽)。所以内存事务不能在全局内存中合并。 我可能会在这里犯一些错误。请帮助找出错误或给我一个合理的解释。谢谢。
【问题讨论】:
标签: cuda coalesce bank-conflict