【问题标题】:GCC inclusion of AVX512's "Fused Multiply Add" instructions when compiling for Cascade-Lake processors为 Cascade-Lake 处理器编译时,GCC 包含 AVX512 的“Fused Multiply Add”指令
【发布时间】:2021-03-29 21:41:05
【问题描述】:

根据gcc's documention,使用“-march=cascadelake”编译不会启用标志 -AVX512IFMA(如果我理解正确,它启用了对 AVX512 的 FMA 指令的支持)。相比之下,例如在使用“-march=cannonlake”和“-march=tigerlake”进行编译时会包含此标志。

然而,根据英特尔的说法,Cascade-Lake 的处理器实际上每个都包含 2 个 AVX-512 FMA 单元(这里是 example,据我所知,这适用于任何 Cascade-Lake 处理器)。

谁能澄清这种行为?我是否误解了 AVX512IFMA 标志的含义?

【问题讨论】:

    标签: gcc intel cpu-architecture avx512 fma


    【解决方案1】:

    SKX/CSX 上的 AVX-512 FMA 单元支持作为 AVX512F 扩展一部分的 FMA 指令。这些指令对浮点操作数进行操作。 AVX512IFMA 指令对 52 位无符号整数操作数进行操作。它们是不同的指令集。 Wikipedia 在每个 AVX-512 扩展中都有 list 的指令。

    【讨论】:

      猜你喜欢
      • 2017-08-27
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-09-22
      • 2019-11-27
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多