【发布时间】:2012-07-11 17:30:29
【问题描述】:
这个问题类似于earlier 提出的问题,但我认为不考虑内存分页。所以,我在这里再次提出类似的问题:
// version 1
int nums[100];
int* pNum = nums;
for(int i=0;i<100;i++,pNum++){
foo(pNum);
}
// version 2
for(int i=0;i<100;i++){
foo(nums[i]);
}
哪个版本会更快?之前有人说生成的汇编代码会非常相似,因为两个版本都需要递增内存地址的位置,但是考虑到一个非常大的数组,内存分页性能会显着改变吗?因为其中一个需要长移位,而另一个需要从数组的基内存地址移位?我知道它非常依赖于平台/编译器,但仍想了解人们的常见做法,尤其是处理大型数据类型,如图像处理或科学计算?谢谢。
【问题讨论】:
-
尝试两者的时间并自己看看。但我警告说,现代编译器非常有能力将一种形式转换为另一种形式。所以可能很难进行基准测试。
-
你不应该担心这样的小细节。编译器足够聪明,无论您如何编写它都可以优化它。此外,像这样的微优化几乎都是浪费时间。效率低下的原因通常要大得多。
-
实际上,这是一个面试问题,我已经说过类似@templatetypedef 的内容,但我认为这对芯片组制造商来说真的很重要。
-
@Mysticial,如果我在关闭编译器优化的情况下尝试两个版本是否有意义?
-
TBH,我之前实际上已经玩过这个特定的优化。而且没有明确的赢家。它们不一样,但都不是总是更快。当您增加多个指针时,它会变得很有趣。第一个版本有更多的增量,但第二个版本有间接寻址和更多的寄存器压力。我已经看到高达 50% 的差异。但如前所述,它非常依赖于硬件和编译器的环境。我认为它是一种难以解决的微优化。
标签: c++ optimization pointers compiler-construction paging