【问题标题】:Programmatically retrieve maximum number of blocks per multiprocessor以编程方式检索每个多处理器的最大块数
【发布时间】:2014-04-26 13:04:34
【问题描述】:

有没有办法以编程方式检索可容纳在多处理器上的最大块数?我知道,如果我想达到每个多处理器的最大块数,那么我需要弄清楚在不限制块数的情况下我可以使用多少线程和多少共享内存。 (哦,还有寄存器的最大数量)

但是,我在看

http://developer.download.nvidia.com/compute/cuda/4_1/rel/toolkit/docs/online/structcudaDeviceProp.html

而且我没有看到以编程方式检索每个多处理器的最大块数的方法。

有没有办法做到这一点?

【问题讨论】:

    标签: cuda


    【解决方案1】:

    据我所知,没有 API 函数可以直接检索此号码。

    您可以通过检索计算能力主要版本并使用the programming guide 中的信息来创建自己的函数。如果 cc 1.x 或 2.x,它是每个多处理器 8 个块。如果 cc 3.x 是每个多处理器 16 个块。如果抄送 5.x it's 32 blocks.

    这并不能保证您的代码不会过时,但它可能是最好的方法。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2013-07-13
      • 2021-08-09
      • 2011-11-20
      • 2019-12-28
      • 2012-07-18
      • 2011-04-07
      • 2018-01-14
      • 2019-12-01
      相关资源
      最近更新 更多