【问题标题】:C++ Optimize if/else statementC++ 优化 if/else 语句
【发布时间】:2016-10-03 00:42:29
【问题描述】:

我编写了以下代码来模拟和简化我的应用程序中发生的事情。

在这个简化中,我有 ifelse 分支,它们执行相同的代码,但写入不同的内存部分。所以我想使用一个包含两个条目的数组,并根据语句条件更新第一个或第二个条目。
该解决方案带来了预期的加速。

但是当我们在执行期间对每次迭代都有一个随机访问时,改进几乎消失了。为了展示这种奇怪的行为,我使用模板来激活或停用 if 语句和随机访问的使用,即
useif:使用 if 语句时为 true,当使用 if 语句时为 false使用内存访问。
rand_access:当我们对每次迭代都有随机访问时为 true,否则为 false。

#include <chrono>
#include <iostream>
#include <vector>
#include <numeric>
#include <algorithm>
#define N 1000000000
using namespace std;
using namespace std::chrono;

template <bool useif, bool rand_access>
void exec(vector<int>& V, vector<bool>& B) {
    auto start = high_resolution_clock::now();
    int sum[2], sum1 = 0, sum2 = 0;
    sum[0] = 0; sum[1] = 0;
    for ( int i = 0; i < N; i++ ) {
        const int index = (rand_access) ? V[i] : i;
        if ( useif ){
            if ( B[index] ) sum2 += V[i];
            else sum1 += V[i];
        } else
            sum[B[index]] += V[i];
    }
    auto t = std::chrono::duration_cast<milliseconds>(high_resolution_clock::now() - start);
    std::cout << "Time useif="<<useif<<", rand_access="<<rand_access<<" : " << t.count() << " ms" << std::endl;
    std::cout << (sum1+sum2+sum[0]+sum[1]) << std::endl;
}

int main() {
    vector<int> V(N);
    vector<bool> B(N, false);
    iota( V.begin(), V.end(), 0 );
    random_shuffle( V.begin(), V.end() );
    fill( B.begin(), B.begin() + B.size()/2, true);
    random_shuffle( B.begin(), B.end() );
    exec<false, false>(V, B);
    exec<false, true>(V, B);
    exec<true, false>(V, B);
    exec<true, true>(V, B); 
    return 0;
}

在我的机器上,使用 g++ --std=c++11 -O3 -march=native -mtune=native 编译,得到以下结果:
时间 useif=0, rand_access=0 : 1518 ms
时间 useif=0, rand_access=1 : 10791 ms
时间 useif=1, rand_access=0 : 4384 ms
时间 useif=1, rand_access=1 : 12214 ms

所以,当 NOT 涉及随机访问时,用内存访问替换 if 语句会加快 2.8,否则性能真的很差关闭(1.1 加速)。

我不明白为什么会发生这种情况以及如何处理它,即我如何优化 if 语句知道 ifelse 分支正在执行相同的代码?

【问题讨论】:

  • 你遵守了优化标志,对吧?
  • 你应该得到VB的内存地址并访问C数组。访问向量[] 有一些开销。由于无法使用内存缓存预取,随机访问效率较低。
  • 缓存未命中会在使用随机访问时导致延迟。使用“if”时管道停止

标签: c++ if-statement optimization


【解决方案1】:

您使用数组优化if/else 是正确的。它总是会给你带来改进,但改进的重要性也取决于其他因素。

您的实验显示了分支消除和缓存访问优化的相对影响。

当代码按顺序访问内存时,由于引用的局部性,它会利用 CPU 缓存优化,只为一小部分内存访问“付费”。使用 64 字节缓存行,对于存储在连续位置的 4 字节整数,它就像一个令人难以置信的“买一送十五”策略。它让您的 CPU 无需等待内存中的数据就可以继续添加。

当代码没有分支时,它利用 CPU 指令流水线。使用难以预测的条件命中 if 会使管道停止,因此同时“运行”的指令更少。

从带有分支的随机访问到带有分支的顺序访问可以节省 7.8 秒;消除分支可以额外节省 2.8 秒。

相比之下,在没有顺序访问的情况下消除分支只会给您带来 1.5 秒的改进,因为当 CPU 无论如何都在等待内存时,消除管道停顿变得不那么重要了。

【讨论】:

  • 您说过这种优化总是会带来改进。但是我在我的应用程序中发现,这种优化比使用 if 语句的优化要慢。为了删除 if 语句,我使用了一个由两个结构组成的数组,其中包含必须更改的数据,并具有一个更改所有这些数据的方法“更新”。您认为这样进行是否正确?为什么你认为它更慢?
  • @Draxent 如果struct 足够大,写入额外数据的成本最终可能会消耗掉不停止管道所节省的成本。在极少数情况下,您可以跳过循环中操作的else 部分,并在单个计算中执行循环后的计算。在您的示例中,这将分配 sum1 = n*(n+1)/2 - sum2
猜你喜欢
  • 1970-01-01
  • 2020-11-23
  • 2011-05-18
  • 2023-03-28
  • 1970-01-01
  • 2014-03-13
  • 2017-06-16
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多