【发布时间】:2013-12-06 18:24:09
【问题描述】:
几个月来一直在玩这个宏大的 CUDA 实验,我发现自己在做更多的实验,并试图从教程示例中抽离出来。
我的问题是:如果我只想将 GPU 上的数组用于临时存储之类的东西,而不将它们复制回主机进行显示/输出,我可以只使用__device__ double array[numpoints]; 创建一个设备数组吗?那么对于任何我想从 GPU 拿回来,我需要做整个 cudaMalloc、cudaMemcpy 的 spiel,对吗?此外,一种方法或另一种方法之间有什么区别吗?我以为他们都在全局内存中创建数组。
【问题讨论】: