【问题标题】:How to associate events, metrics and source-level results for profiling a pyCUDA program using nvvp如何关联事件、指标和源级结果以使用 nvvp 分析 pyCUDA 程序
【发布时间】:2015-12-07 15:13:27
【问题描述】:
当我尝试使用 nvvp 分析我的 pyCUDA 应用程序时,它在大多数情况下都有效。我可以点击“Examine GPU Usage”并查看我的代码的一些分析结果/建议,例如“Low Compute / Memcpy Efficiency”。
但是,每次 nvvp 运行程序执行分析时,我都会看到以下警告。
某些收集的事件、指标或源级结果无法与会话时间线相关联。这可能会阻止将事件、指标和源级别的结果分配给某些内核。
如果我采取措施解决这个问题,我似乎可以获得更详细的分析。有谁知道如何将“收集的事件、指标或源级结果与会话时间线”相关联?
【问题讨论】:
标签:
profiling
pycuda
nvvp
【解决方案1】:
正如探查器文档中所示:
◦当使用选项 --kernels kernel-filter 时,Visual Profiler 无法正确导入 nvprof 生成的分析器数据。 Visual Profiler 报告警告,“某些收集的事件或源级结果无法与会话时间线相关联。”一种解决方法是使用 nvprof 选项 --kernels :::1 来分析所有内核的第一次调用。
所以您可以尝试更改此选项