【发布时间】:2020-11-15 22:39:47
【问题描述】:
OpenCL 有一个名为native_recip 的内置函数:
gentype native_recip(gentype x);
native_recip在实现定义的范围内计算倒数。最大错误是实现定义的。数学函数的向量版本以组件方式运行。描述是针对每个组件的。
内置数学函数不受调用环境中流行的舍入模式的影响,并且始终返回与使用舍入到最接近的偶数舍入模式调用时相同的值。
CUDA中是否有与此功能等效的功能?
【问题讨论】:
-
__frcp_xx。查看数学库文档中的内在部分