【发布时间】:2015-07-10 07:19:04
【问题描述】:
我是 cuda 编程的新手。我正在开发具有
的 Kepler GPU3.2 compute_capability
1024 max_threads_per_block
1 Multiprocessor
2048 max._threads per_Multiprocessor
2147483647 grid size
这是否意味着我只能为内核分配 2048 ?那么这么大的网格怎么办呢?
我的应用程序包含大量的矩阵计算。
【问题讨论】: