【发布时间】:2015-05-18 01:26:16
【问题描述】:
我正在尝试优化 pyOpenCL 程序。出于这个原因,我想知道是否有一种方法可以分析程序并查看大部分时间需要在哪里。
你知道如何解决这个问题吗?
提前致谢
安迪
编辑:例如,用于 CUDA 的 nvidias nvprof 可以为 pyCuda 解决问题,但不适用于 pyOpenCL。
【问题讨论】:
-
@en_Knight:您的帖子是关于纯 python 的。这对我没有帮助。您能否重新检查一下,如果帖子不同,请取消标记。