【发布时间】:2023-04-10 17:54:01
【问题描述】:
我的问题是,假设输入缓冲区是一个图像,并且它的像素正在内核中处理,当我们在 GPU 上 clenqueueNDRangeKernel 任务时,该任务是否被所有计算单元分割和处理?如果是这样,GPU 利用率是否应该在每次运行时都达到 100%?如果不是这样,您能否指出我在哪里可以澄清 GPU 的使用百分比?
【问题讨论】:
-
这在很大程度上取决于您提交了多少工作项,以及这些工作项达到了多少计算单元占用率。您排队的工作项越多,它们使用的私有(注册)和本地(共享)内存越少,您的利用率就越高。