【发布时间】:2012-07-08 13:11:52
【问题描述】:
我想在 NVIDIA GPU 上截取 PTX 级别的 opencl 程序。
我想例程可能看起来像这样。
首先,我编写了一个 opencl 程序(主机和设备代码),使用 NVIDIA 编译器生成各自的 ptx 代码。然后我通过修改PTX代码来写我想做的事情(请不要问为什么我没有在设备C代码上这样做——我有一些原因)。但问题是,修改后如何将这个PTX代码编译成二进制代码?
【问题讨论】:
-
使用 CUDA 工具链和 CUDA 驱动程序 API。我不相信有办法用 OpenCL 处理汇编代码或内联汇编指令。
-
这适用于 CUDA wili.cc/blog/ptx.html。也可能适用于 OpenCL
标签: cuda opencl gpu nvidia ptxas