【发布时间】:2011-03-29 16:59:28
【问题描述】:
我仍然对这些未知大小的矩阵感到生气,每个维度可能在 10-20.000 之间变化。
我正在查看 CUDA sdk 并想知道:如果我选择的块数太高怎么办?
类似于 X 和 Y 维度上 9999 x 9999 块的网格,如果我的硬件具有无法容纳所有这些块的 SM,内核会出现问题还是性能会崩溃?
我不知道如何在块/线程中标注可能变化很大的东西。我正在考虑使用我的硬件支持的最大块数,然后让其中的线程在所有矩阵中工作,这是正确的方法吗?
【问题讨论】: