【发布时间】:2012-12-13 14:20:46
【问题描述】:
我正在尝试将用 C 编写的较小程序翻译成 openCL。我应该将一些输入数据传输到 GPU,然后使用连续的内核调用在设备上执行所有计算。
但是,由于使用的数据量很大,我必须避免在 CPU 和 GPU 之间来回传输数据,因此我在处理不适合并行化的部分代码时遇到了困难。
有没有办法在没有并行处理的情况下执行一些内核,以便我可以用它们替换这些代码部分?这是通过将全局工作大小设置为 1 来实现的吗?
【问题讨论】:
标签: opencl