【发布时间】:2017-04-09 23:44:37
【问题描述】:
我有以下问题。我有 6000 * 1000 个元素需要并行处理(大部分时间)。但是,在内核的某些部分,这 6000 项必须加在一起。
当我尝试将内核输入设置为 (globalThreads = 6000 * 1000, localThreads = 6000) 时,它似乎抛出了一个错误 (CL_INVALID_WORK_GROUP_SIZE)。似乎一个工作组中的本地元素的最大数量是有限的。
我该如何解决这个问题?
【问题讨论】:
标签: opencl