【发布时间】:2016-03-07 17:22:07
【问题描述】:
我正在尝试使用单纯形优化解决 GPU 上的熵问题。因为单纯形的每次迭代都依赖于前一个迭代,所以我相信我无法让我的算法并行。
然而,在对 PyOpenCl 和 Numbapro 进行了一些研究之后,OpenCl 提供了一种称为 SIMD 的编程架构。我只是想知道 Numbapro 是否会提供相同的功能?
到目前为止,我已经对部分代码尝试了 jit、autojit 和矢量化,但没有任何性能提升的迹象。
【问题讨论】:
我正在尝试使用单纯形优化解决 GPU 上的熵问题。因为单纯形的每次迭代都依赖于前一个迭代,所以我相信我无法让我的算法并行。
然而,在对 PyOpenCl 和 Numbapro 进行了一些研究之后,OpenCl 提供了一种称为 SIMD 的编程架构。我只是想知道 Numbapro 是否会提供相同的功能?
到目前为止,我已经对部分代码尝试了 jit、autojit 和矢量化,但没有任何性能提升的迹象。
【问题讨论】:
是的,确实如此。
请在https://developer.nvidia.com/how-to-cuda-python 观看视频 - 它准确显示了您感兴趣的内容。
【讨论】: