【发布时间】:2016-07-21 02:21:19
【问题描述】:
有谁知道 Tensorflow 编译的可执行文件 here 是否包含 AVX 支持?我一直在 Google Compute Engine 上运行该编译版本的 Tensorflow,而且速度很慢。狗慢。冷糖浆慢。洛杉矶交通缓慢。 This article 表示使用 AVX 支持进行编译可以显着提高 Google Compute Engine 的性能,但是当我按照该站点上的编译过程进行操作时,它会失败。只是想知道 AVX 是否已经在可执行文件中?
【问题讨论】:
-
用
objdump -d之类的东西拆开它,然后寻找%ymm。如果您曾经将该字符串视为寄存器名称的一部分,则代码使用的是 AVX。 (英特尔语法不使用%前缀将寄存器名称与符号名称分开,因此只需查找 ymm0 到 ymm15)。当然,这不会检测到像vmulps %xmm0, %xmm1, %xmm2这样的AVX 128 位指令,所以你也可以寻找vmulps。前导v和(通常)3 个操作数表示它是 AVX 指令,而不是传统 SSE。
标签: performance tensorflow machine-learning google-compute-engine avx