启用 AVX 时，Clang 会产生较慢的代码？

【问题标题】：Clang produces slower code when AVX is enabled?启用 AVX 时，Clang 会产生较慢的代码？
【发布时间】：2012-11-04 21:44:48
【问题描述】：

我将 Xcode 4.5.2 与“Apple LLVM Compiler 4.1”（Clang）一起使用。

我尝试编译一个严重依赖于启用 AVX 的 SSE 内在函数的代码（没有 _mm256* 函数，也没有 __m256 变量）并且得到的代码比仅启用 SSE 4.2 时的代码慢。

这有什么合理的解释吗？

【问题讨论】：

如果您使用任何 SSE 库函数在 VEC 编码的 SSE（如在 AVX 中）和旧版 SSE 之间切换而不使用 vzeroupper 可能会导致严重停顿。除此之外，它应该更快，因为 VEC 编码了三个操作数指令。通过为 AVX 重新编译，我在纯 128 位代码中获得了 10% 的收益。
谢谢。如何检查代码中是否有这样的切换功能（可能来自我使用的第三方库）？

标签： xcode clang sse vectorization avx

【解决方案1】：

目前 LLVM 已打开与 AVX 性能相关的错误，例如 such as this one。

完整的 avx 相关错误列表可以在 here 找到。

【讨论】：

猜你喜欢

1970-01-01
2018-04-22
1970-01-01
2023-03-09
1970-01-01
2020-01-23
1970-01-01
1970-01-01
2016-02-14

相关资源

下载 2022-12-16
下载 2023-01-10
下载 2023-01-21
下载 2023-02-08

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode