【发布时间】:2020-11-19 20:24:30
【问题描述】:
当我列出 nvprof 的指标时
nvprof --query-events
我明白了:
thread_inst_executed:活动线程执行的指令数。对于每条指令,它按执行指令的线程数(包括断定线程)递增。它不包括重播。
我想使用这个指标,所以我使用以下方法收集指标:
nvprof --csv --metrics thread_inst_executed,inst_executed,inst_executed_global_loads,inst_executed_global_stores,inst_executed_local_loads,inst_executed_local_stores,inst_executed_shared_loads,inst_executed_shared_stores,gld_transactions,gst_transactions,local_load_transactions,local_store_transactions,shared_load_transactions,shared_store_transactions,l2_read_transactions,l2_write_transactions,dram_read_transactions,dram_write_transactions,sysmem_read_transactions,sysmem_write_transactions ./my_program my arguments
输出包含我要求的所有指标...除了thread_inst_executed。为什么它不见了?我怎样才能得到它?
【问题讨论】:
-
因为事件和指标不是一回事。一方面,您查询了事件。另一方面,您要求提供指标,但提供了事件的名称。如果你真的想列出 nvprof 的指标,你应该做
--query-metrics而不是--query-eventsdocs.nvidia.com/cuda/profiler-users-guide/… -
@RobertCrovella:如果你想把它写下来作为答案,这对我有用。
-
@Richard:随意添加您自己的答案
标签: cuda gpu profiling nvidia nvprof