【发布时间】:2013-08-01 15:26:32
【问题描述】:
我正在使用 NEON 对 ARM 处理器进行代码优化。但是我有一个问题:我的算法包含以下浮点计算:
round(x*b - y*a)
结果可以是正面的也可以是负面的。
实际上,我使用 2 个 VMUL 和 1 个 VSUB 进行并行计算(每次操作使用 Q 寄存器和 32 位浮点数 4 个值)。
有办法解决这个问题吗?如果结果都是相同的符号,我知道我可以简单地加或减 0.5
【问题讨论】:
标签: optimization assembly arm neon