【发布时间】:2013-07-09 09:50:22
【问题描述】:
我在实习期间尝试在 GPU 上并行化对象定位算法。但是 OpenCL 的最大浮点精度变得很成问题。
参考算法一直使用双精度实现,特别是对于 SVM 分类器和描述符。我的以单精度实现导致错误。我检查了我的标准化错误,并在程序的几个点 (10^-6) 得到了我所期望的结果。
但是,在流程的分类步骤之后,这些错误变得更加重要。
有没有办法用只支持单精度的 GPU 来模拟双精度值?
PS:我可以在我的 GPU (Nvidia GTS450) 上使用双精度,但该程序将在几个平台上进行测试,功率要小得多,这可能意味着没有双精度。
【问题讨论】:
-
谢谢,我会研究的!