【问题标题】:Interpreting the verbose output of ptxas, part II解释 ptxas 的详细输出,第二部分
【发布时间】:2023-03-12 05:26:01
【问题描述】:

这个问题是Interpreting the verbose output of ptxas, part I的延续。

当我们使用ptxas -v 编译内核.ptx 文件,或使用-ptxas-options=-v.cu 文件编译它时,我们会得到几行输出,例如:

ptxas info    : Compiling entry function 'searchkernel(octree, int*, double, int, double*, double*, double*)' for 'sm_20'
ptxas info    : Function properties for searchkernel(octree, int*, double, int, double*, double*, double*)
    72 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads
ptxas info    : Used 46 registers, 176 bytes cmem[0], 16 bytes cmem[14]

(与链接到的问题中的示例相同;但使用名称去修饰)

这个问题是关于最后一行的。其他内核的更多示例:

ptxas info    : Used 19 registers, 336 bytes cmem[0], 4 bytes cmem[2]
...
ptxas info    : Used 19 registers, 336 bytes cmem[0]
... 
ptxas info    : Used 6 registers, 16 bytes smem, 328 bytes cmem[0]

除了使用的寄存器数量之外,我们如何解释这一行的信息?具体来说:

  • cmem 是常量内存的缩写吗?
  • 为什么cmem有不同的类别,即cmem[0]cmem[2]cmem[14]
  • smem 可能代表shared memory;它只是静态共享内存吗?
  • 每种条目在什么情况下会出现在这一行?

【问题讨论】:

  • 是的,cmem 指的是常量内存。 here 列出了不同的“类别”(banks)。我没有看到 smem 出现在这个问题或链接问题的任何地方,但它不可能引用 dynamic 共享内存,因为它在编译时是未知的(大小方面) .

标签: cuda verbose gpu-shared-memory gpu-constant-memory ptxas


【解决方案1】:

cmem 是常量内存的缩写吗?

是的

为什么cmem有不同的类别,即cmem[0]、cmem[2]、cmem[14]?

它们代表不同的常量内存库。 cmem[0] 是内核参数和静态大小的常量值的保留库。

smem 可能代表共享内存;它只是静态共享内存吗?

是的,不然怎么可能。

每种条目在什么条件下出现在这一行?

大部分回复here

【讨论】:

  • +1 获取信息,但我觉得答案以过度对话的方式列出,所以我也让自己写一个。
【解决方案2】:

已收集并重新格式化...

最后一个 ptxas 信息行的资源:

  • registers - 在每个 SM(多处理器)上的寄存器文件中
  • gmem - 全局内存
  • smem - 静态共享内存
  • cmem[N] - 索引为 N 的常量内存库。
    • cmem[0] - 为内核参数和静态大小的常量值保留的库
    • cmem[2] - ???
    • cmem[4] - ???
    • cmem[14] - ???

如果内核使用任何此类内存,则将显示这些类别中的每一个(寄存器 - 可能总是显示);因此,所有示例都显示了一些 cmem[0] 用法也就不足为奇了。

您可以在Section 2.3 of the Programming Guide 和那里的链接中阅读更多关于 CUDA 内存层次结构的信息。此外,还有关于静态与动态共享内存的this blog post

【讨论】:

    猜你喜欢
    • 2012-09-05
    • 2019-09-08
    • 1970-01-01
    • 2021-09-03
    • 2018-08-30
    • 1970-01-01
    • 2014-09-03
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多