【发布时间】:2016-04-28 07:59:38
【问题描述】:
我想从我的 GPU 应用程序中提取数据以检查其限制。我必须使用 nvprof,因为应用程序在远程服务器上运行,所以我应该创建一个文件以在 Visual Profiler 中本地导入。我尝试使用 nvprof -o file_name <app> <params> 和 nvprof --analysis-metrics --output-profile file_name <app> <params> 创建文件,但是当我在 Visual Profiler 上导入这些文件时,在 Analysis 部分中的某些字段为空:“全局内存负载数据不足”、“全局内存存储数据不足”、“内核 SM 数据不足”......我如何生成一个文件(或更多文件)以获得分析部分的所有信息?我使用带有标志-lineinfo -arch compute_20 -code sm_20 --ptxas-options=-v 的nvcc 编译cuda 代码。
以下是一些空字段的示例:
【问题讨论】:
-
我在 cuda
vectorAdd样本上运行了您的nvprof --analysis-metrics ...命令。在可视化分析器的分析选项卡和详细信息选项卡中,我对分析数据没有任何问题。也许您需要更具体地了解您的确切测试用例以及您正在寻找数据的确切位置。我相信“数据不足”消息是您正在分析的实际内核/代码的结果,与分析器本身无关。 -
感谢@RobertCrovella 的回复。我添加了一个带有空字段示例的图像。
-
我收到这个“警告”消息的次数,没有来自用户界面的任何关于如何解决它的指导,这非常令人愤怒。这是在 9.0 上......现在怎么还没修复? Nvidia 肯定没有破产!