【发布时间】:2012-11-28 20:09:48
【问题描述】:
我正在阅读 CUDA_C_Programming_Guide,在共享内存主题中,我遇到了一个示例: 设备计算能力:1.0,共享内存中的 16 个存储库
extern __shared__ float shared[];
float data = shared[BaseIndex + s * tid];
在他们得出的解释中,'s' 必须是奇数,谁能帮我理解s 为偶数时会发生什么以及s 为奇数时会发生什么?
【问题讨论】:
-
This answer 可能会帮助您入门
-
@talonmies:感谢您的回复。我看到了你在共享内存中为 pre-fermi 架构发布的 A[16][16] 的解决方案。但我无法理解银行是如何安排的;即 Row0 与 bank0,row1 与 bank1,等等?或者你能用这里发布的图片来解释:stackoverflow.com/questions/13534695/…
标签: cuda