【发布时间】:2018-01-18 02:55:19
【问题描述】:
我想在 GPU 上并行化 Python 循环,但我不想使用 pyCUDA,因为我需要自己做很多事情。我正在寻找像 C++ 中的 OpenACC 之类的东西来实现简单的并行化,但似乎没有这样的东西。所以我想在 C++ 中使用 OpenACC,然后系统调用 Python 脚本,如下面的代码所示。这行得通吗?或者有没有不使用 pyCUDA 的简单替代方案?
void foo(float*parameters){
%%system call python function with parameters as input
}
#pragma acc parallel loop
for ( int i=0; i<n; ++i) {
foo(parameters[i]);
//call on the device
}
【问题讨论】: