【发布时间】:2012-01-21 07:14:51
【问题描述】:
我正在使用以下代码来计时对cudaMalloc() 的调用。我很好奇:CUDA 事件是否只为我们的内核计时,或者它们也为“内置内核”计时。也就是说,下面cudaMalloc()的计时方法有效吗?
cudaEvent_t start, stop;
cudaEventCreate(&start);
cudaEventCreate(&stop);
cudaEventRecord(start, 0);
for(int t =0 ; t < 100 ; t++){
float* test;
cudaMalloc((void**)&test, 3000000 * sizeof(float));
cudaFree(test);
}
cudaEventRecord(stop, 0);
cudaEventSynchronize(stop);
float elapsedTime;
cudaEventElapsedTime(&elapsedTime , start, stop);
printf("time elapsed on the GPU: %f ms", elapsedTime/100);
【问题讨论】:
标签: cuda gpu cpu-usage nvidia timing