【发布时间】:2014-05-06 23:07:04
【问题描述】:
在谷歌上我能找到的最好的是
float32x4_t vmulq_lane_f32 (float32x4_t, float32x2_t, const int)
Form of expected instruction(s): vmul.f32 q0, q0, d0[0]
查看 neon 程序员指南表明它是向量到标量乘法。但也有其他 API 可用于此目的。
float32x4_t vmulq_n_f32 (float32x4_t, float32_t)
Form of expected instruction(s): vmul.f32 q0, q0, d0[0]
所以我仍然不知道第一个 API 的目的是什么,以及其中的车道概念是什么。 编辑:以上信息来源:http://gcc.gnu.org/onlinedocs/gcc/ARM-NEON-Intrinsics.html
【问题讨论】:
-
广播由索引参数指定的第二个向量参数的元素并将其乘以第一个向量参数。
-
标量
float和float32xN_t的一个元素在概念上可能是同一件事,但就 C 编译器而言,它们非常不同。为什么不两者都支持?
标签: floating-point arm neon intrinsics