【问题标题】:how to calculate theoretical fp32 instructions per cycle (IPC) on nvidia GPU如何在 nvidia GPU 上计算每周期理论 fp32 指令(IPC)
【发布时间】:2014-04-05 17:39:50
【问题描述】:

根据http://on-demand.gputechconf.com/gtc-express/2011/presentations/Inst_limited_kernels_Oct2011.pdf 第 9 页,我很难理解 Fermi 架构英伟达 GPU 的理论每周期指令 (IPC) 是 2。

根据编程指南 (http://docs.nvidia.com/cuda/cuda-c-programming-guide/#arithmetic-instructions) 的第 5.4.1 节,对于 32 位浮点数,可以有 32 个 fp32 指令/SM/时钟周期。

这两个量有什么关系?

【问题讨论】:

    标签: cuda gpu gpgpu nvidia


    【解决方案1】:
    猜你喜欢
    • 2015-12-13
    • 2018-12-28
    • 2017-11-04
    • 1970-01-01
    • 2020-04-09
    • 2012-01-15
    • 1970-01-01
    • 1970-01-01
    • 2015-09-09
    相关资源
    最近更新 更多