【问题标题】:Cuda profiling speed concernCuda profiling 速度问题
【发布时间】:2016-05-06 14:50:30
【问题描述】:

当我使用 nvcc 构建可执行文件时,默认情况下,我可以使用 nvprof 或 Nvidia 可视化分析器 GUI 对其进行分析。我担心的是,即使我没有真正对其进行分析,我的可执行文件也可能无法以最佳方式运行,因为它“能够”记录或发出有关分析的信息。所以,我觉得默认情况下,可执行文件是在启用分析的情况下构建的。

奇怪这个问题以前没有被问过,答案对我来说并不明显。是否有禁用分析的编译器选项,尤其是对于发布模式?或者分析是完全免费的?

【问题讨论】:

    标签: cuda profiling


    【解决方案1】:

    是否有禁用分析的编译器选项,尤其是对于发布模式?或者分析是完全免费的?

    没有禁用分析的编译器选项。它是完全免费的。

    【讨论】:

    • 这个完全免费包含ptx指令pmevent吗?
    • 你不会发现 pmevent 是从普通 CUDA C/C++ 代码的编译中发出的,我认为这是我在这里看到的。当然,如果您直接在 PTX 中编码,并且您对 pmevent 指令进行编码,或者在代码中使用 CUDA C/C++ 分析 API 导致发出 pmevent 指令,那么您将支付该指令的成本.说了这么多,没有任何编译开关会以任何方式改变 pmevent 的成本。
    • 感谢您的宝贵补充。
    • @RobertCrovella 感谢您的回答,这是我想确定的。您还可以引用任何提到这一点的官方文件吗?
    • 我不确定您到底在寻找什么。也许阅读profiler docs 之类的东西会很有意义,包括前面的声明:“CUDA 分析工具不需要任何应用程序更改即可启用分析”。这意味着分析支持是透明的。如果有一种方法来构建应用程序以禁用分析支持,那么必须在该部分中指出这一点,以便用户知道如何正确准备应用程序以进行分析。
    猜你喜欢
    • 2014-01-10
    • 2016-07-29
    • 2011-05-15
    • 2011-11-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多