【发布时间】:2021-07-02 19:55:12
【问题描述】:
我正在使用 NVIDIA Nsight Systems cli (nsys) 来分析一个简单的 cuda 程序(向量添加)。我已经检查了文档,但我认为我遗漏了一些东西。
我正在运行带有--stats=true 标志的nsys profile 命令。
CUDA API Statistics:
Time(%) Total Time (ns) Num Calls Average Minimum Maximum Name
------- --------------- --------- ------------ ---------- ---------- ---------------------
CUDA Kernel Statistics:
Time(%) Total Time (ns) Instances Average Minimum Maximum Name
这就是我要返回的内容(省略了值)。我应该启用某个标志来显示内存统计信息吗?
使用--trace=cuda 标志进行测试,但同样没有内存统计信息
- 主机:Windows 10
- Cuda 工具包版本:11.0
- Nvidia Nsight 版本:2021.1.1
这是 Windows 和 Cuda 之间的兼容性问题,我应该降级吗?我真的不知道。 当我在 Ubuntu 中运行相同的命令时工作正常。真是快把我逼疯了。
欢迎任何帮助 谢谢
【问题讨论】: