【发布时间】:2014-04-26 13:04:34
【问题描述】:
有没有办法以编程方式检索可容纳在多处理器上的最大块数?我知道,如果我想达到每个多处理器的最大块数,那么我需要弄清楚在不限制块数的情况下我可以使用多少线程和多少共享内存。 (哦,还有寄存器的最大数量)
但是,我在看
而且我没有看到以编程方式检索每个多处理器的最大块数的方法。
有没有办法做到这一点?
【问题讨论】:
标签: cuda
有没有办法以编程方式检索可容纳在多处理器上的最大块数?我知道,如果我想达到每个多处理器的最大块数,那么我需要弄清楚在不限制块数的情况下我可以使用多少线程和多少共享内存。 (哦,还有寄存器的最大数量)
但是,我在看
而且我没有看到以编程方式检索每个多处理器的最大块数的方法。
有没有办法做到这一点?
【问题讨论】:
标签: cuda
据我所知,没有 API 函数可以直接检索此号码。
您可以通过检索计算能力主要版本并使用the programming guide 中的信息来创建自己的函数。如果 cc 1.x 或 2.x,它是每个多处理器 8 个块。如果 cc 3.x 是每个多处理器 16 个块。如果抄送 5.x it's 32 blocks.
这并不能保证您的代码不会过时,但它可能是最好的方法。
【讨论】: