【发布时间】:2014-04-05 17:39:50
【问题描述】:
根据http://on-demand.gputechconf.com/gtc-express/2011/presentations/Inst_limited_kernels_Oct2011.pdf 第 9 页,我很难理解 Fermi 架构英伟达 GPU 的理论每周期指令 (IPC) 是 2。
根据编程指南 (http://docs.nvidia.com/cuda/cuda-c-programming-guide/#arithmetic-instructions) 的第 5.4.1 节,对于 32 位浮点数,可以有 32 个 fp32 指令/SM/时钟周期。
这两个量有什么关系?
【问题讨论】: