【发布时间】:2011-09-22 17:02:34
【问题描述】:
我想将我的 c 代码移植到 CUDA。主要计算部分包含3个for嵌套循环:
for (int i=0; i< Nx;i++){
for (int j=0;j<Ncontains[i];j++){
for (int k=0;k< totalVoxels;k++){
.......
}
}
}
如何将其转换为我的 CUDA 内核?使用两个 for 循环,我可以执行以下操作:
int n= blockIdy.y * blockDim.y + threadIdx.y;
int i= blockIdx.x * blockDim.x + threadIdx.x;
但是我如何才能开始运行呢?
【问题讨论】: