【发布时间】:2011-09-10 10:29:02
【问题描述】:
在 GPU 上查找 FFT 的最快库是哪个?请给出 NVIDIA 和 ATI 卡的答案。另外,如果可能的话,给出时间数字。
谢谢。
【问题讨论】:
-
用于 cuda 的 libjacket(我相信是 C/C++)非常快。我没有任何时间信息。不过,它是商业的。
-
你出去试试怎么样?我怀疑你有很多选择。
在 GPU 上查找 FFT 的最快库是哪个?请给出 NVIDIA 和 ATI 卡的答案。另外,如果可能的话,给出时间数字。
谢谢。
【问题讨论】:
对于 NVidia GPU,请查看 CUFFT library。据我所知,AMD 尚未在 ATI GPU 上生产 FFT,但可能值得一看 ACML-GPU 库。您还可以尝试查看OpenCL FFT libraries,它应该在两个 GPU 上都可以工作。
给出时间数字是不可能的,因为它会根据您拥有的实际硬件、问题大小等而有很大差异。
【讨论】:
NukadaFFT 库应该是 NVIDIA 硬件上性能最高的 FFT 实现。有一些论文链接记录了库的性能——在某些情况下,吞吐量据称比使用 CUFFT 运行相同的 FFT 高 25%。这是以灵活性为代价的,因为代码最多只支持基数 32 的转换。
【讨论】: