【发布时间】:2016-02-11 00:46:51
【问题描述】:
我了解处理 4 字节数据类型时的银行冲突,但我想知道 如果我们使用以下代码遇到任何银行冲突(4 路/8 路?)
__shared__ char shared[];
foo = shared[threadIdx.x];
上面的代码导致一个warp中的4个连续线程访问同一个bank中的同一个字地址。
类似的内存访问模式是否会导致任何 cuda 设备系列的存储库冲突?显然,它只适用于旧卡,但我想确认一下。
我的问题可以进一步概括,如果多个线程访问同一个银行可寻址单元 [8 字节或 4 字节],但每个线程都需要它的一小部分。硬件会在没有任何银行冲突的情况下处理此类请求吗?谢谢
【问题讨论】: