【发布时间】:2012-02-26 08:04:33
【问题描述】:
可以使推力函数使用多个 GPU 计算,如果有的话? 我已经编写了这个 Thrust 代码,它可以很好地与单个 显卡。 (Tesla C2050)但我还附加了另外三张 Tesla C2050 卡 到我想用于我的计算的机器。
我知道一台机器连接了多个 GPU,我可以运行一个 每个 GPU 并行的 CUDA 内核,即设备 0 上的内核 0,内核 1 上 设备 1 等。 但就我而言,我想在一次推力上使用所有 4 个 GPU 函数调用,比如 saythrust::sort。这可能吗?
【问题讨论】: