【问题标题】:Is there a CUDA equivalent of native_recip() in OpenCL?OpenCL 中是否存在与 native_recip() 等效的 CUDA?
【发布时间】:2020-11-15 22:39:47
【问题描述】:

OpenCL 有一个名为native_recip 的内置函数:

gentype native_recip(gentype x);

native_recip 在实现定义的范围内计算倒数。最大错误是实现定义的。

数学函数的向量版本以组件方式运行。描述是针对每个组件的。

内置数学函数不受调用环境中流行的舍入模式的影响,并且始终返回与使用舍入到最接近的偶数舍入模式调用时相同的值。

CUDA中是否有与此功能等效的功能?

【问题讨论】:

  • __frcp_xx。查看数学库文档中的内在部分

标签: cuda opencl porting


【解决方案1】:

如 cmets 中所述,float__frcp_rn()double__drcp_rn();以及矢量类型的实现(例如float4),以便逐元素应用 frcp/drcp。

注意:“rcp”是“reciprocal”的缩写,“rn”是舍入模式"round to nearest even"

【讨论】:

    猜你喜欢
    • 2022-06-17
    • 2012-05-14
    • 1970-01-01
    • 2021-04-26
    • 2011-11-08
    • 2011-03-20
    • 1970-01-01
    • 2016-10-15
    • 2010-11-24
    相关资源
    最近更新 更多