【发布时间】:2012-02-23 04:11:06
【问题描述】:
我在我的程序中执行的一个常见操作是按标量缩放向量(V*s,例如 [1,2,3,4]*2 == [2,4,6,8])。除了首先在向量中的每个位置加载标量(例如 _mm_set_ps(2,2,2,2))然后相乘之外,是否有 SSE(或 AVX)指令来执行此操作?
这就是我现在所做的:
__m128 _scalar = _mm_set_ps(s,s,s,s);
__m128 _result = _mm_mul_ps(_vector, _scalar);
我正在寻找类似...的东西
__m128 _result = _mm_scale_ps(_vector, s);
【问题讨论】: