使用中间变量而不是 array.length 会使你的 for 循环更快吗？答案

【问题标题】：Does using an intermediate variable instead of array.length make your for-loop faster?使用中间变量而不是 array.length 会使你的 for 循环更快吗？
【发布时间】：2025-12-16 03:25:01
【问题描述】：

"Performance Tips" section in the Android documentation 有一个非常大胆的主张：

one() 更快。它将所有内容提取到局部变量中，避免查找。只有数组长度才能提供性能优势。

这里指的是这段代码sn-p:

int len = localArray.length;

for (int i = 0; i < len; ++i) {
    sum += localArray[i].mSplat;
}

这让我很吃惊，因为localArray.length 只是访问一个整数，如果您要使用中间变量，则必须再次执行完全相同的步骤。我们真的是说只需转到x 而不是y.x 的中间变量更快吗？

我查看了this question，它的想法大致相同，但使用了数组列表及其后续的.size() 方法。这里的共识似乎是没有区别，因为无论如何该方法调用可能只是内联到整数访问（这正是我们这里的场景）。

所以我用字节码来看看它是否能告诉我什么。

给出以下源代码：

public void MethodOne() {
    int[] arr = new int[5];
    for (int i = 0; i < arr.length; i++) { }
}

public void MethodTwo() {
    int[] arr = new int[5];
    int len = arr.length;
    for (int i = 0; i < len; i++) { }
}

我得到以下字节码：

public void MethodOne();
    Code:
        0: iconst_5
        1: newarray       int
        3: astore_1
        4: iconst_0
        5: istore_2
        6: iload_2
        7: aload_1
        8: arraylength
        9: if_icmpge     18
        12: iinc          2, 1
        15: goto          6
        18: return

public void MethodTwo();
    Code:
        0: iconst_5
        1: newarray       int
        3: astore_1
        4: aload_1
        5: arraylength
        6: istore_2
        7: iconst_0
        8: istore_3
        9: iload_3
        10: iload_2
        11: if_icmpge     20
        14: iinc          3, 1
        17: goto          9
        20: return

它们在以下说明中有所不同：

方法一

6: iload_2
7: aload_1
8: arraylength
9: if_icmpge     18
12: iinc          2, 1
15: goto          6
18: return

方法二

9: iload_3
10: iload_2
11: if_icmpge     20
14: iinc          3, 1
17: goto          9
20: return

现在，我不能 100% 确定我必须如何解释 8: arraylength，但我认为这只是表示您正在访问的字段。第一种方法加载索引计数器和数组并访问arraylength 字段，而第二种方法加载索引计数器和中间变量。

我还使用 JMH（10 次预热、10 次迭代、5 次分叉）对这两种方法进行了基准测试，结果如下：

c.m.m.Start.MethodOne    thrpt        50  3447184.351    19973.900   ops/ms
c.m.m.Start.MethodTwo    thrpt        50  3435112.281    32639.755   ops/ms

这告诉我差异可以忽略不计甚至不存在。

Android 文档声称在循环条件中使用中间变量的依据是什么？

【问题讨论】：

可能是因为 n 是固定的，而 arrayName.length() 每次迭代都会被评估。不过，不完全确定。
Java 将数组和字符串长度作为内部变量保存 - 不会在每次调用时都被评估（现在找不到任何参考 - 请确认或拒绝）
也许该建议适用于较旧的 JIT？
arraylength 是不是字段的名称。这是一个actual JVM instruction，它执行弹出、取消引用和推送。
我记得做过类似的事情，第二个版本实际上比第一个慢。原因可能是第一个没有执行任何绑定检查，除了第一个和最后一个元素。我不记得我正在运行的 java 版本

标签： java performance for-loop benchmarking bytecode

【解决方案1】：

您误解了文档。他们不是指您所描述的内容（尽管我不怪您，但他们应该在这些文档中付出更多努力:)）。

它将所有内容提取到局部变量中，避免查找。

通过避免查找他们引用field vs local variable access cost。访问字段（文档示例中的mArray）需要先加载this，然后根据this 的固定偏移量加载字段。

一段时间后，JIT 可能会弄清楚发生了什么并优化字段访问（如果该字段不是 volatile 或循环中发生某种其他形式的同步）并重写代码，以便所有参与循环的变量在 CPU 寄存器和缓存中被访问/更改，直到循环结束。

一般来说，JIT 可能需要做更多的工作来确定与存储在局部变量中的引用相比，优化对从字段引用的数组长度的访问是否安全。假设我们有以下循环：

for (int i = 0; i < array.length; ++i) {
    process(array[i]);
}

如果array 是一个字段并且process 调用了数千行复杂代码，那么JIT 可能会发现很难检查array 字段是否在循环中的某处更改以引用其他具有长度不同。

显然，在这种情况下检查局部变量是否改变要容易得多（三行代码）。

【讨论】：

好吧，他们特别说 JIT 不能为字段访问执行此操作。但我同意这是对文档的误解。
此外，JIT 并不总是存在。如果我错了，请纠正我，但它从 2.3 开始出现。
@RealSkeptic 真的，谢谢你的评论。但一般来说，JIT 做起来没有障碍；也许这是Android的当前实现。 Java 内存模型允许它。 Here (section 2.3) 是针对 JRockit JVM 进行此类优化的一个示例。
@DmitryZaitsev 那么这可以解释他们在文档中的含义 - 如果当前的 Android JIT 无法优化它（或者如果根本没有 JIT，当然，循环中的字段访问可能会很昂贵） :))。
有趣的是，OP 忽略了另一个声明，即使用 for (Foo a : mArray) 循环的方法 two()（文档有三个以 zero() 开头的方法）在没有 JIT 的系统上更快。这更令人困惑，因为它取决于实际编译器生成的字节码是否在one() 和two() 之间有任何区别。我闻到了深奥的优化技术……

【解决方案2】：

实际上，它并没有使循环更快，使用 String.length() 时你的想法是正确的
不同之处在于 array.length 只是一个具有值的字段，您可以直接使用它..
String.length() 是一个需要时间执行的方法。

【讨论】：