【发布时间】:2018-09-17 22:23:48
【问题描述】:
我正在使用多内核 OpenCL 实现,但我不确定不同的内核如何映射到计算单元。
我的所有内核都是同时执行的,我认为只有执行相同内核的工作组才会分配给单个计算单元。所以我推断我使用的每个不同内核都至少有一个计算单元。我对吗?
我知道我可以使用 clGetDeviceInfo 并查看字段 CL_DEVICE_MAX_COMPUTE_UNITS,但它并没有告诉我内核是如何分布的或我正在使用多少计算单元。
与这个问题相关,如果我没有指定“attribute((num_compute_units(X)))”将使用多少个计算单元,使用多少个?
谢谢
【问题讨论】:
标签: concurrency parallel-processing opencl