【发布时间】:2011-11-06 05:51:40
【问题描述】:
我目前在我的 OpenCL 内核中处理了大量的浮点数,我想知道我是否将这个数组分开并使用 OpenCL 向量类型数组来代替,如果它会加速这个过程。基本上,如果我有一个包含 4,800 个浮点数的数组,我会将它分成一个包含 300 个 float16 向量的数组。这会利用 SIMD 吗?
【问题讨论】:
-
OpenCL 应该已经利用了底层硬件的 SIMD 特性,否则它对于 GPU 编程将毫无用处。我不确定它在 CPU 上的作用,尽管 CPU 并不是 OpenCL 发挥其优势的完美领域。
标签: math vector floating-point opencl simd