【发布时间】:2012-04-13 10:40:47
【问题描述】:
我是 OpenCl 的新手。
我需要对一维双精度数组进行归约(求和运算符)。
我一直在网上闲逛,但我发现的例子很混乱。 任何人都可以发布一个易于阅读(并且可能高效)的教程实现吗?
附加信息: - 我可以使用一台 GPU 设备; - 我使用 C 作为内核代码
【问题讨论】:
-
AMD 的例子很容易理解。 developer.amd.com/documentation/articles/Pages/…
-
@mfa 确实如此。它适用于小尺寸的输入,但不幸的是我的向量是 60000 个元素,因此它不适合本地内存。我实现了它,但发现本地内存限制为时已晚。