【发布时间】:2021-05-26 17:43:09
【问题描述】:
CUDA 11 features announcement,据说现在有:
新的链接时间优化功能
nvcc 实际采用了哪些链接时优化(例如,相对于使用 g++ 或 clang++ 的主机端代码中的 LTO 功能)?
另外 - 是否需要做一些事情来启用 LTO,或者它是否总是会发生(与需要使用 -flto 开关编译的主机端代码不同?
【问题讨论】:
-
我还没有探索过这个新功能,但我会假设跨编译单元的函数内联是这些功能之一。应该很容易通过简单的实验来确认或反驳。
标签: cuda compiler-optimization nvcc compiler-options lto