【发布时间】:2017-09-15 16:44:22
【问题描述】:
我正在尝试加快我的算法在 FPGA 上的执行速度。我正在尝试在 C 代码中寻找长度为 32:32 (64) 的固定数学库,这些库很容易转换为 OpenCL。有没有人知道好的图书馆?我试图避免使用 128 位数据类型,因为它们是 OpenCL 上的浮点数,我想如果我必须再次使用浮点数,它不会加速我的算法。任何建议表示赞赏。如果有创建自己的库的指南,我可以接受,只要它解释得足够简单,哈哈。
谢谢
【问题讨论】:
-
我想你会发现定点库比只在设备上使用浮点硬件要慢。如今,浮点已经得到了很好的优化,而整数单元在 GPU 上的性能并不那么强大,因为大多数图形算法都使用浮点。
-
是的,但在 FPGA 上这不是真的,因为它们在浮点计算数量方面无法击败 GPU。所以我正在考虑测试定点,看看它比浮点快多少。跨度>
-
好点。我对 FPGA OpenCL 的实现并不熟悉,只在 CPU 或 GPU 方面发言。
标签: opencl fixed-point