【发布时间】:2026-01-31 20:15:01
【问题描述】:
有没有人在 2 个不同的 CUDA 流中成功运行 2 个不同的内核并让它们同步?基本上我想让 1 个内核 A 将数据发送到另一个同时运行的内核 B(在不同的流中),然后返回结果。原因:内核 A 在 1 个 CUDA 线程中运行,我想要内核 B 的多 GPU 线程实现。
这是使用高端 GPU (Fermi/Tesla)、CUDA 4.2
相同的 GPU,不同的流。所以数据应该可以通过设备内存进行通信,但是如何同步它们呢?
【问题讨论】:
-
您在没有说明问题的情况下询问特定解决方案是否可行。在这个特定的例子中,您会发现更好地陈述您的问题,以便社区可以为您提供受 CUDA 编程模型支持的解决方案。