【问题标题】:Export CUDA nvprof output to the Visual Profiler将 CUDA nvprof 输出导出到 Visual Profiler
【发布时间】:2016-04-28 07:59:38
【问题描述】:

我想从我的 GPU 应用程序中提取数据以检查其限制。我必须使用 nvprof,因为应用程序在远程服务器上运行,所以我应该创建一个文件以在 Visual Profiler 中本地导入。我尝试使用 nvprof -o file_name <app> <params>nvprof --analysis-metrics --output-profile file_name <app> <params> 创建文件,但是当我在 Visual Profiler 上导入这些文件时,在 Analysis 部分中的某些字段为空:“全局内存负载数据不足”、“全局内存存储数据不足”、“内核 SM 数据不足”......我如何生成一个文件(或更多文件)以获得分析部分的所有信息?我使用带有标志-lineinfo -arch compute_20 -code sm_20 --ptxas-options=-vnvcc 编译cuda 代码。 以下是一些空字段的示例:

【问题讨论】:

  • 我在 cuda vectorAdd 样本上运行了您的 nvprof --analysis-metrics ... 命令。在可视化分析器的分析选项卡和详细信息选项卡中,我对分析数据没有任何问题。也许您需要更具体地了解您的确切测试用例以及您正在寻找数据的确切位置。我相信“数据不足”消息是您正在分析的实际内核/代码的结果,与分析器本身无关。
  • 感谢@RobertCrovella 的回复。我添加了一个带有空字段示例的图像。
  • 我收到这个“警告”消息的次数,没有来自用户界面的任何关于如何解决它的指导,这非常令人愤怒。这是在 9.0 上......现在怎么还没修复? Nvidia 肯定没有破产!

标签: cuda nvvp nvprof


【解决方案1】:

您可以尝试添加会话,而不是将 prof 文件导入可视分析器。 我遇到了类似的问题。我所做的是根据here中的说明添加一个会话,您将能够看到所有信息。

【讨论】:

  • 当您说“添加会话”时,您的意思是您根本没有导入 nvprof 结果,对吗?也就是说,您根本不直接依赖 nvprof。
  • 如果视觉分析器不使用 nvprof,那么你是对的。但我猜视觉分析器应该在实时分析期间使用 nvprof 作为后端工具。不确定,但可能。
猜你喜欢
  • 1970-01-01
  • 2014-11-26
  • 1970-01-01
  • 2016-06-23
  • 2016-04-05
  • 1970-01-01
  • 2014-02-23
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多