【发布时间】:2023-03-09 05:48:01
【问题描述】:
我在许多论坛上读到 NVIDIA Visual Profiler 会序列化程序以收集时序信息。
但是,在可视化分析器中,在上下文选项卡下,会提供诸如 “GPU 上的内存副本和内核之间没有时间重叠”之类的建议,或者如果内存和内核执行存在重叠,它会显示重叠的时间。此外,如果您查看the following webinar - slide 6,您可以看到重叠内核的输出跟踪。
我想知道分析器是否可以显示有关并发内核执行的信息(即,如果我们使用 3 个不同的流并行运行 3 个内核,分析器是否可以显示这是否确实发生在 GPU 中)。如果是这样,我可以在可视化分析器中的什么位置获取这些信息。
【问题讨论】: