【问题标题】:memory bound kernel and compute bound kernel in GPUsGPU 中的内存绑定内核和计算绑定内核
【发布时间】:2012-10-10 03:51:17
【问题描述】:

什么是“GPU 中的内存绑定内核和计算绑定内核”

这与 GPU 的性能有关吗?

【问题讨论】:

    标签: kernel gpu nvidia


    【解决方案1】:

    通俗地说,如果内核的大部分时间都花在执行内存指令上,那么内核就是内存受限的。相反,如果大多数操作是 ALU-FPU 指令,则内核是计算密集型的。 GPU 具有高内存和计算带宽,可以同时适用于这两个类别。这些术语用于分类并指示哪些优化技术可以显着提高应用程序的性能。

    每个类别的工作负载都有不同的优化技巧。

    例如,对于内存受限的工作负载:

    • 利用共享内存
    • 内存访问合并
    • 记忆露营。

    对于计算密集型工作负载:

    • 减少分支分歧
    • 在 ALU-FPU 和 SFU
    • 提供足够的独立指令来利用 ILP。

    【讨论】:

    • 什么是内存露营,找不到任何来源。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-05-23
    • 2013-09-13
    • 2014-04-06
    • 2017-02-13
    • 1970-01-01
    • 2015-06-29
    相关资源
    最近更新 更多