【发布时间】:2017-01-26 18:18:12
【问题描述】:
我认为我的内核受内存限制(因为大多数 GPGPU 代码受内存限制),但我实际上并不确定。我怎么能自己发现它。可能必须使用视觉分析器,因为它取决于使用的 GPU。
如果 CUDA 编程指南或其他 NVIDIA 文档中对此进行了解释,请不要犹豫,发布带有页码的链接,以便我自己阅读。
澄清
我更喜欢一般“规则”如何确定限制因素,但在我的特殊情况下,您可以在此处找到有关我的内核的详细信息:Using `overlap`, `kernel time` and `utilization` to optimize one's kernels
【问题讨论】:
-
您是否根据 CUDA 占用率计算器检查了内核启动配置和属性?一定要试试。然后,分析也是一个好主意。源代码分析也很有用......你的算术强度是多少?您的全局内存访问是否已合并?等等。
标签: cuda