【发布时间】:2011-04-03 00:03:27
【问题描述】:
clock() 不够准确。
【问题讨论】:
-
我相信他的意思是线程块,CUDA 使用的术语。
-
我的意思是每个块都被分配了整个计算的不同部分。我想测试每个块用于完成自己的任务的准确时间。
-
我一直在使用 clock() 但没有注意到它有多不准确。你能告诉我吗?我认为它是准确的,因为它调用了 GPU 内部的时钟性能计数器。
-
@cnhk 您能否在您的问题中提供更多信息,以便该问题对其他 stackoverflow 用户有用。 clock() 设备函数是周期准确的,因此不清楚您为什么认为它不准确。不准确的原因可能包括不正确使用clock()、未能处理翻转、编译器移动SASS指令等。
标签: cuda gpu parallel-processing