【发布时间】:2011-08-28 03:00:36
【问题描述】:
假设我有一个代码可以让用户通过threads_per_block 来调用内核。然后我想检查输入是否有效(例如 =2.0)。
现在我想知道如果我用nvcc -arch=sm_13 编译代码,而我的计算机中有一个CC2.0 显卡,当用户通过threads_per_block == 1024 时会发生什么?这是:
- 有效输入 - 因为我运行的卡有 CC2.0,或者...
- 因为我为 CC1.3 编译它而无效?
或者nvcc -arch=sm_13只是意味着CC1.3至少是必要的,但是在更高的CC上运行时,尽管可以使用那些更高的功能?
【问题讨论】:
标签: cuda nvcc ptx compute-capability