【发布时间】:2013-04-08 00:42:08
【问题描述】:
目前我正在通过联合访问我的浮点值
typedef union
{
float v[4];
_mm128 m;
}SSEFloat;
但是在这个link 我听说性能是损失。 GCC 4 有性能损失吗? float 需要对齐吗?也在联盟?或者这样设置值是否正确
SSEFloat a;
float tmp = 10.0;
a.m = _mm_load1_ps( &tmp );
目前我也找不到英特尔 SSE 内在文档 :( 是否有一个“小”列表 - 速度优化需要知道什么?
【问题讨论】:
-
hmm.. 现在找到了software.intel.com/sites/default/files/m/9/4/c/8/e/…:P