【发布时间】:2017-11-26 20:29:16
【问题描述】:
问题在于不同输入大小的执行时间序列中存在一些不连续性。 具体来说,我一直在尝试这段代码:
long double a[2000][2000];
int iter = 0;
int main(int argc, char const *argv[]){
istringstream is(argv[1]);
int N;
is >> N;
for(int i = 0; i <= N; ++i){
for (int J = 0; J <= N; ++J){
a[i][J] = (rand()%3+1)*(rand()%4+1);
}
}
clock_t clk= clock();
for(int k = 0; k < N; ++k){
for(int i = k+1; i < N; ++i){
a[i][k] = a[i][k]/a[k][k];
}
for(int i = k+1; i < N; ++i){
for(int j = k+1; j < N; ++j){
iter++;
a[i][j] = a[i][j] - a[i][k]*a[k][j];
}
}
}
clk = clock() - clk;
cout << "Time: " << ((double)clk)/CLOCKS_PER_SEC << "\n";
cout << iter << endl;
}
使用 g++ 5.4.1 进行 C++14 编译。
我尝试了 N 的各种值的代码。然而,在 N = 500 附近发生了一些非常奇怪的事情。执行时间如下所列。 (这些是不同 N 值的代码输出。
N = 200 : 0.022136
N = 300 : 0.06792
N = 400 : 0.149622
N = 500 : 11.8341
N = 600 : 0.508186
N = 700 : 0.805481
N = 800 : 1.2062
N = 900 : 1.7092
N = 1000 : 2.35809
我尝试了 N = 500 很多次,并且还在另一台机器上尝试了类似的结果。
我们有大约 500 个:
N = 494 : 0.282626
N = 495 : 0.284564
N = 496 : 11.5308
N = 497 : 0.288031
N = 498 : 0.289903
N = 499 : 11.9615
N = 500 : 12.4032
N = 501 : 0.293737
N = 502 : 0.295729
N = 503 : 0.297859
N = 504 : 12.4154
N = 505 : 0.301002
N = 506 : 0.304718
N = 507 : 12.4385
为什么会这样?
【问题讨论】:
-
将
a和iter声明为... -
我可以确认上面的结果是准确的。也许迭代器变量被调用更多?
-
这可能是由于缓存的影响。我现在没有时间详细检查所有代码,但可能值得一看 igoro.com/archive/gallery-of-processor-cache-effects(特别是示例 5)
-
@AdityaJain,如果您使用的是 linux,请尝试使用 perf。它应该给你很多指标。包括缓存争用。
-
可以在ideone上转载(ideone.com/FGA8UJ):400、600、800都可以。 500 由于超时而失败。难以置信!
标签: c++ compiler-optimization execution-time