【发布时间】:2011-09-08 19:03:23
【问题描述】:
我问这个是因为我知道有一种方法可以使用二进制文件而不是源文件。
另外,我猜用汇编语言模拟函数指针会更容易。除非 GPU 上的程序集与 CPU 上的程序集完全不同。
【问题讨论】:
-
CUDA 的 C 有什么问题? developer.download.nvidia.com/compute/cuda/2_1/toolkit/docs/…
-
几周前回答in an answer to "Is it possible to put instructions into CUDA code?"。 注意: 不是公认的答案,而是后来出现的答案。
-
@dmckee +1。此外,由于支持 CUDA 3.2(和 2.0 设备)函数指针而无需干预 ptx。而较旧的设备根本没有设备函数之类的东西——所有从内核对
__device__函数的调用都是内联的。