【发布时间】:2011-05-22 10:15:34
【问题描述】:
我是 CUDA 范式的新手。我的问题是确定每个块的线程数和每个网格的块数。有一点艺术和试验的作用吗?我发现很多例子都为这些东西选择了看似任意的数字。
我正在考虑一个问题,我可以将任意大小的矩阵传递给乘法方法。因此,C 的每个元素(如 C = A * B)将由单个线程计算。在这种情况下,您将如何确定线程/块、块/网格?
【问题讨论】:
标签: cuda dimensions nvidia matrix-multiplication