【问题标题】:Does using an intermediate variable instead of array.length make your for-loop faster?使用中间变量而不是 array.length 会使你的 for 循环更快吗?
【发布时间】:2025-12-16 03:25:01
【问题描述】:

"Performance Tips" section in the Android documentation 有一个非常大胆的主张:

one() 更快。它将所有内容提取到局部变量中,避免查找。只有数组长度才能提供性能优势。

这里指的是这段代码sn-p:

int len = localArray.length;

for (int i = 0; i < len; ++i) {
    sum += localArray[i].mSplat;
}

这让我很吃惊,因为localArray.length 只是访问一个整数,如果您要使用中间变量,则必须再次执行完全相同的步骤。我们真的是说只需转到x 而不是y.x 的中间变量更快吗?

我查看了this question,它的想法大致相同,但使用了数组列表及其后续的.size() 方法。这里的共识似乎是没有区别,因为无论如何该方法调用可能只是内联到整数访问(这正是我们这里的场景)。

所以我用字节码来看看它是否能告诉我什么。

给出以下源代码:

public void MethodOne() {
    int[] arr = new int[5];
    for (int i = 0; i < arr.length; i++) { }
}

public void MethodTwo() {
    int[] arr = new int[5];
    int len = arr.length;
    for (int i = 0; i < len; i++) { }
}

我得到以下字节码:

public void MethodOne();
    Code:
        0: iconst_5
        1: newarray       int
        3: astore_1
        4: iconst_0
        5: istore_2
        6: iload_2
        7: aload_1
        8: arraylength
        9: if_icmpge     18
        12: iinc          2, 1
        15: goto          6
        18: return

public void MethodTwo();
    Code:
        0: iconst_5
        1: newarray       int
        3: astore_1
        4: aload_1
        5: arraylength
        6: istore_2
        7: iconst_0
        8: istore_3
        9: iload_3
        10: iload_2
        11: if_icmpge     20
        14: iinc          3, 1
        17: goto          9
        20: return

它们在以下说明中有所不同:

方法一

6: iload_2
7: aload_1
8: arraylength
9: if_icmpge     18
12: iinc          2, 1
15: goto          6
18: return

方法二

9: iload_3
10: iload_2
11: if_icmpge     20
14: iinc          3, 1
17: goto          9
20: return

现在,我不能 100% 确定我必须如何解释 8: arraylength,但我认为这只是表示您正在访问的字段。第一种方法加载索引计数器和数组并访问arraylength 字段,而第二种方法加载索引计数器和中间变量。

我还使用 JMH(10 次预热、10 次迭代、5 次分叉)对这两种方法进行了基准测试,结果如下:

c.m.m.Start.MethodOne    thrpt        50  3447184.351    19973.900   ops/ms
c.m.m.Start.MethodTwo    thrpt        50  3435112.281    32639.755   ops/ms

这告诉我差异可以忽略不计甚至不存在。


Android 文档声称在循环条件中使用中间变量的依据是什么?

【问题讨论】:

  • 可能是因为 n 是固定的,而 arrayName.length() 每次迭代都会被评估。不过,不完全确定。
  • Java 将数组和字符串长度作为内部变量保存 - 不会在每次调用时都被评估(现在找不到任何参考 - 请确认或拒绝)
  • 也许该建议适用于较旧的 JIT?
  • arraylength不是字段的名称。这是一个actual JVM instruction,它执行弹出、取消引用和推送。
  • 我记得做过类似的事情,第二个版本实际上比第一个慢。原因可能是第一个没有执行任何绑定检查,除了第一个和最后一个元素。我不记得我正在运行的 java 版本

标签: java performance for-loop benchmarking bytecode


【解决方案1】:

您误解了文档。他们不是指您所描述的内容(尽管我不怪您,但他们应该在这些文档中付出更多努力:))。

它将所有内容提取到局部变量中,避免查找。

通过避免查找他们引用field vs local variable access cost。访问字段(文档示例中的mArray)需要先加载this,然后根据this 的固定偏移量加载字段。

一段时间后,JIT 可能会弄清楚发生了什么并优化字段访问(如果该字段不是 volatile 或循环中发生某种其他形式的同步)并重写代码,以便所有参与循环的变量在 CPU 寄存器和缓存中被访问/更改,直到循环结束。

一般来说,JIT 可能需要做更多的工作来确定与存储在局部变量中的引用相比,优化对从字段引用的数组长度的访问是否安全。假设我们有以下循环:

for (int i = 0; i < array.length; ++i) {
    process(array[i]);
}

如果array 是一个字段并且process 调用了数千行复杂代码,那么JIT 可能会发现很难检查array 字段是否在循环中的某处更改以引用其他具有长度不同。

显然,在这种情况下检查局部变量是否改变要容易得多(三行代码)。

【讨论】:

  • 好吧,他们特别说 JIT 不能为字段访问执行此操作。但我同意这是对文档的误解。
  • 此外,JIT 并不总是存在。如果我错了,请纠正我,但它从 2.3 开始出现。
  • @RealSkeptic 真的,谢谢你的评论。但一般来说,JIT 做起来没有障碍;也许这是Android的当前实现。 Java 内存模型允许它。 Here (section 2.3) 是针对 JRockit JVM 进行此类优化的一个示例。
  • @DmitryZaitsev 那么这可以解释他们在文档中的含义 - 如果当前的 Android JIT 无法优化它(或者如果根本没有 JIT,当然,循环中的字段访问可能会很昂贵) :))。
  • 有趣的是,OP 忽略了另一个声明,即使用 for (Foo a : mArray) 循环的方法 two()(文档有三个以 zero() 开头的方法)在没有 JIT 的系统上更快。这更令人困惑,因为它取决于实际编译器生成的字节码是否在one()two() 之间有任何区别。我闻到了深奥的优化技术……
【解决方案2】:

实际上,它并没有使循环更快,使用 String.length() 时你的想法是正确的
不同之处在于 array.length 只是一个具有值的字段,您可以直接使用它..
String.length() 是一个需要时间执行的方法。

【讨论】: