【发布时间】:2013-02-01 06:52:17
【问题描述】:
我是学习 CUDA 并行编程的新手。现在我对设备的全局内存访问感到困惑。这是关于扭曲模型和合并的。
有几点:
据说一个块中的线程被分割成warp。在每个经纱中最多有 32 个线程。这意味着同一个warp的所有这些线程将在同一个处理器上同时执行。那么半曲折的意义是什么?
当涉及到一个块的共享内存时,它会被分成16个bank。为了避免银行冲突,多个线程可以同时读取一个银行,而不是写入同一个银行。这是正确的解释吗?
提前致谢!
【问题讨论】:
标签: cuda bank-conflict