【问题标题】:How to compare two vectors using SIMD and get a single boolean result?如何使用 SIMD 比较两个向量并获得单个布尔结果?
【发布时间】:2011-10-16 01:12:41
【问题描述】:

我有两个向量,每个向量包含 4 个整数,我想使用 SIMD 命令来比较它们(比如根据比较结果生成一个结果向量,其中每个条目为 0 或 1)。

然后,我想将结果向量与 4 个零的向量进行比较,并且只有当它们相等时才做某事。

您知道我可以使用哪些 SIMD 命令来执行此操作吗?

【问题讨论】:

  • 您使用的是哪种架构?所有 SIMD 都是不同的。
  • 我对此非常陌生,所以请原谅我的无知。我正在尝试使用 Intel Parallel Studio 的平台包含 SIMD 命令(这是否以任何方式回答了您的问题?)。

标签: assembly x86 sse simd


【解决方案1】:

比较两个 SIMD 向量:

#include <stdint.h>
#include <xmmintrin.h>

int32_t __attribute__ ((aligned(16))) vector1[4] = { 1, 2, 3, 4 };
int32_t __attribute__ ((aligned(16))) vector2[4] = { 1, 2, 2, 2 };
int32_t __attribute__ ((aligned(16))) result[4];

__m128i v1 = _mm_load_si128((__m128i *)vector1);
__m128i v2 = _mm_load_si128((__m128i *)vector2);
__m128i vcmp = _mm_cmpeq_epi32(v1, v2);
_mm_store_si128((__m128i *)result, vcmp);

注意事项:

  • 数据假定为 32 位整数
  • vector1vector2result都需要16字节对齐
  • 结果将是 -1 表示相等,0 表示不相等({ -1, -1, 0, 0 } 用于上述代码示例)

更新

如果您只想要一个布尔结果来处理所有 4 个元素都匹配的情况,那么您可以这样做:

#include <stdint.h>
#include <xmmintrin.h>

int32_t __attribute__ ((aligned(16))) vector1[4] = { 1, 2, 3, 4 };
int32_t __attribute__ ((aligned(16))) vector2[4] = { 1, 2, 2, 2 };

__m128i v1 = _mm_load_si128((__m128i *)vector1);
__m128i v2 = _mm_load_si128((__m128i *)vector2);
__m128i vcmp = _mm_cmpeq_epi32(v1, v2);
uint16_t mask = _mm_movemask_epi8(vcmp);
int result = (mask == 0xffff);

【讨论】:

  • 谢谢。当我得到结果向量时,是否有一种简单的方法来检查它是否全为零(我想要一个布尔值来表示它是否全为零)。
  • 如果我想获得更大的结果,我可以使用 _mm_cmpgt_epi32,对吧?
  • @N.M:是的,_mm_cmpgt_epi32.
  • vector1 & 2 后面需要 [] 否?
  • 错字:_mm_movemask_epi8 返回和 int,没有 __m128i。
猜你喜欢
  • 1970-01-01
  • 2014-02-24
  • 1970-01-01
  • 2014-09-06
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-07-16
  • 1970-01-01
相关资源
最近更新 更多