【发布时间】:2015-12-03 09:54:52
【问题描述】:
我正在按照this SO answer 上的说明进行操作,但是当我尝试运行生成的 PTX 文件时,我在 clBuild 中收到以下错误
ptxas fatal : Unresolved extern function 'get_group_id'
在 PTX 文件中,我使用的每个 OpenCL 函数调用都有以下内容
.func (.param .b64 func_retval0) get_group_id
(
.param .b32 get_group_id_param_0
)
;
当我提供一个 CL 文件时,OpenCL 运行时创建的 PTX 文件中不存在上述内容。相反,它有适当的特殊寄存器。
按照these instructions(链接到不同的 libclc 库)在 LLVM IR 到 PTX 编译期间给我一个分段错误,并出现以下错误:
fatal error: error in backend: Cannot cast between two non-generic address spaces
这些说明仍然有效吗?还有什么我应该做的吗?
我正在使用最新版本的 libclc、Clang 3.7 和 Nvidia 驱动程序 352.39
【问题讨论】:
标签: clang opencl llvm-clang