【发布时间】:2015-11-19 06:12:49
【问题描述】:
类似于this question,在 CUDA Math API 中使用内部函数(单、双或半)有什么好处。我知道有些有更快(不太准确)的版本,例如__fdivdef,这些版本总是可以与-use_fast_math 一起使用,但是其他功能呢。例如,为什么要使用__fadd_rd(A,B) 而不是A+B 或__fmaf_rd(A,B,C) 而不是A+B+C?我能想到的一个原因是可以更方便地选择舍入方法 - 很好。
还有一些函数,例如__fmul_rd“将永远不会合并到单个乘加指令中”(根据 CUDA Math API 文档)。为什么会有好处?
【问题讨论】:
标签: cuda