【发布时间】:2020-03-07 17:33:51
【问题描述】:
如何使用 cuda 事件测量 cudaMalloc 的执行时间? 我能够通过事件测量内核时间和 cudaMemcpy 时间,但它不适用于 cudaMalloc。使用下面的代码,我得到执行时间 3.104e-06 秒(这是错误的)。使用 Nvidia Nsight Compute 我得到 0.109 秒。
cudaEventRecord(startCuda);
cudaMalloc(&devMatrix, allocSize);
cudaEventRecord(stopCuda);
cudaEventSynchronize(stopCuda);
cudaEventElapsedTime(&timeCudaMalloc, startCuda, stopCuda);
【问题讨论】: