【发布时间】:2018-10-23 12:24:34
【问题描述】:
我最初的工作单元大小为11*11*6779。为了简单起见,我不想将其转换为 1D 全局工作大小。当我将其更改为 21*21*6779 时,性能比以前慢 5-6 倍。据我所知,代码与正在运行的线程数无关。
传输的数据量只有 4x 大,我认为这不是程序运行速度较慢的原因,因为我测试了内存分配过程。
请注意,我的设备的最大工作项为 256*256*256,这意味着我将使用所有可用工作项的一半,这不是专用设备(也用于显示..)。
我想知道将工作项大小设置为21*21*6779 是否使用了我的工作项太多,或者尺寸只是不方便 openCL 调整?
【问题讨论】:
标签: opencl