OpenCL 浮点精度管理答案

【问题标题】：OpenCL floating point precision managementOpenCL 浮点精度管理
【发布时间】：2013-07-09 09:50:22
【问题描述】：

我在实习期间尝试在 GPU 上并行化对象定位算法。但是 OpenCL 的最大浮点精度变得很成问题。

参考算法一直使用双精度实现，特别是对于 SVM 分类器和描述符。我的以单精度实现导致错误。我检查了我的标准化错误，并在程序的几个点 (10^-6) 得到了我所期望的结果。

但是，在流程的分类步骤之后，这些错误变得更加重要。

有没有办法用只支持单精度的 GPU 来模拟双精度值？

PS：我可以在我的 GPU (Nvidia GTS450) 上使用双精度，但该程序将在几个平台上进行测试，功率要小得多，这可能意味着没有双精度。

【问题讨论】：

【解决方案1】：

【讨论】：