【发布时间】:2016-07-06 20:27:18
【问题描述】:
我正在编写OpenCL 代码以找到最佳工作组大小,以最大程度地占用 GPU。为此,我需要一个函数来返回每个计算单元的最大工作项数。
基本上,我是从CUDA 代码派生出来的,我想要一个等效于maxThreadsPerMultiProcessor 的代码。
在 CUDA 中,这些是设备查询返回的值:
每个多处理器的最大线程数:2048
每个块的最大线程数:1024
在 OpenCL 中: CL_DEVICE_MAX_WORK_GROUP_SIZE:1024
在 CUDA 中,它不要求内核信息返回此值。 我需要 OpenCL 的等效功能。 提前致谢。
【问题讨论】: