【发布时间】:2012-01-18 09:44:15
【问题描述】:
我读到可以使用内核启动来同步不同的块,即,如果我希望所有块在进行操作 2 之前完成操作 1,我应该将操作 1 放在一个内核中,将操作 2 放在另一个内核中。这样,我可以实现块之间的全局同步。但是,cuda c 编程指南提到内核调用是异步的,即。 CPU 不会等待第一个内核调用完成,因此 CPU 也可以在第一个内核完成之前调用第二个内核。但是,如果这是真的,那么我们就不能使用内核启动来同步块。请让我知道我哪里出错了
【问题讨论】: