为什么这个 Java 方法会泄漏——为什么内联它会修复泄漏？答案

【问题标题】：why does this Java method leak—and why does inlining it fix the leak?为什么这个 Java 方法会泄漏——为什么内联它会修复泄漏？
【发布时间】：2019-02-09 16:47:52
【问题描述】：

我编写了一个最小的有点惰性 (int) 序列类 GarbageTest.java，作为一个实验，看看我是否可以像在 Clojure 中那样在 Java 中处理非常长的惰性序列。

给定一个naturals() 方法，它返回惰性的、无限的自然数序列；一个drop(n,sequence) 方法，它删除sequence 的第一个n 元素并返回sequence 的其余部分；和一个简单返回的nth(n,sequence) 方法：drop(n, lazySeq).head()，我写了两个测试：

static int N = (int)1e6;

// succeeds @ N = (int)1e8 with java -Xmx10m
@Test
public void dropTest() {
    assertThat( drop(N, naturals()).head(), is(N+1));
}

// fails with OutOfMemoryError @ N = (int)1e6 with java -Xmx10m
@Test
public void nthTest() {
    assertThat( nth(N, naturals()), is(N+1));
}

请注意，dropTest() 的主体是通过复制 nthTest() 的主体然后在 nth(N, naturals()) 调用上调用 IntelliJ 的“内联”重构来生成的。所以在我看来dropTest() 的行为应该与nthTest() 的行为相同。

但它并不相同！ dropTest() 运行完成，N 最大为 1e8，而 nthTest() 失败，OutOfMemoryError N 小至 1e6。

我避免使用内部类。我已经尝试了我的代码的变体ClearingArgsGarbageTest.java，它在调用其他方法之前将方法参数设为空。我已经应用了 YourKit 分析器。我看过字节码。我只是找不到导致nthTest() 失败的泄漏。

“泄漏”在哪里？为什么nthTest() 有泄漏而dropTest() 没有？

这里是来自GarbageTest.java 的其余代码，以防您不想点击进入 Github 项目：

/**
 * a not-perfectly-lazy lazy sequence of ints. see LazierGarbageTest for a lazier one
 */
static class LazyishSeq {
    final int head;

    volatile Supplier<LazyishSeq> tailThunk;
    LazyishSeq tailValue;

    LazyishSeq(final int head, final Supplier<LazyishSeq> tailThunk) {
        this.head = head;
        this.tailThunk = tailThunk;
        tailValue = null;
    }

    int head() {
        return head;
    }

    LazyishSeq tail() {
        if (null != tailThunk)
            synchronized(this) {
                if (null != tailThunk) {
                    tailValue = tailThunk.get();
                    tailThunk = null;
                }
            }
        return tailValue;
    }
}

static class Incrementing implements Supplier<LazyishSeq> {
    final int seed;
    private Incrementing(final int seed) { this.seed = seed;}

    public static LazyishSeq createSequence(final int n) {
        return new LazyishSeq( n, new Incrementing(n+1));
    }

    @Override
    public LazyishSeq get() {
        return createSequence(seed);
    }
}

static LazyishSeq naturals() {
    return Incrementing.createSequence(1);
}

static LazyishSeq drop(
        final int n,
        final LazyishSeq lazySeqArg) {
    LazyishSeq lazySeq = lazySeqArg;
    for( int i = n; i > 0 && null != lazySeq; i -= 1) {
        lazySeq = lazySeq.tail();
    }
    return lazySeq;
}

static int nth(final int n, final LazyishSeq lazySeq) {
    return drop(n, lazySeq).head();
}

【问题讨论】：

如果您使用 Java，使用 Streams 不是更自然吗？
@AlanThompson 总的来说你是对的。流是“Java 方式”。我这样做是为了尝试以 Haskell/Clojure 方式做事：不可变、惰性、可扩展的序列。更多信息请参见：github.com/vavr-io/vavr/issues/2245#issuecomment-390437457
实验通常很有帮助，但您不想花太多时间“重新发明轮子”。如果您还没有查看，您可能应该查看 Clojure LazySeq 源代码：github.com/clojure/clojure/blob/…
我实验的唯一目的是看看是否可以将 Clojure 风格的不可变、惰性、可扩展序列实现为 Java 库。我的结论是这是不可能的，像 vavr.io 这样的 Java 库将无法做到这一点。我相信，如果我采用 Clojure 序列实现类并从我自己的 Java 代码中调用它们，那么该代码将表现出与我的示例相同的内存消耗——除非我为 JVM 提供了-Xcomp 选项。
您完全可以在不设置任何 JVM 选项的情况下调用 Clojure 类而不会泄漏内存——可能只需要像 Clojure 那样“清除本地变量”。添加了一个答案来解释如何在 Clojure 运行时的 Java 部分完成。

标签： java memory-management clojure garbage-collection sequence

【解决方案1】：

在你的方法中

static int nth(final int n, final LazyishSeq lazySeq) {
    return drop(n, lazySeq).head();
}

参数变量lazySeq 在整个drop 操作期间保存对序列第一个元素的引用。这可以防止整个序列被垃圾收集。

相比之下，与

public void dropTest() {
    assertThat( drop(N, naturals()).head(), is(N+1));
}

你的序列的第一个元素由naturals()返回并直接传递给drop的调用，因此从操作数堆栈中删除并且在drop执行期间不存在。

您尝试将参数变量设置为null，即

static int nth(final int n, /*final*/ LazyishSeq lazySeqArg) {
    final LazyishSeq lazySeqLocal = lazySeqArg;
    lazySeqArg = null;
    return drop(n,lazySeqLocal).head();
}

没有帮助，就像现在一样，lazySeqArg 变量是 null，但 lazySeqLocal 包含对第一个元素的引用。

一般来说，局部变量不会阻止垃圾回收，允许收集其他未使用的对象，但这并不意味着特定实现能够做到这一点。

在 HotSpot JVM 的情况下，只有优化的代码才能摆脱这些未使用的引用。但在这里，nth 并不是热点，因为在drop 方法中发生了重重的事情。

这就是为什么drop 方法中没有出现相同问题的原因，尽管它还包含对其参数变量中第一个元素的引用。 drop 方法包含执行实际工作的循环，因此很可能会被 JVM 优化，这可能会导致它消除未使用的变量，从而允许收集已处理的序列部分。

有很多因素可能会影响 JVM 的优化。除了代码的不同形状之外，似乎在未优化阶段快速分配内存也可能会降低优化器的改进。事实上，当我使用-Xcompile 运行时，为了完全禁止解释执行，两种变体都运行成功，即使int N = (int)1e9 也不再有问题。当然，强制编译会增加启动时间。

我不得不承认，我不明白为什么混合模式的性能那么要差得多，我会进一步调查。但通常，您必须注意垃圾收集器的效率取决于实现，因此在一个环境中收集的对象可能会留在另一个环境中的内存中。

【讨论】：

太棒了。那么，Clojure 编译器如何能够避免此类问题呢？它总是禁止解释执行吗？您甚至在哪里找到了 -Xcompile 的记录？我发现很难用谷歌搜索。
啊，我想我看到它记录在这里例如macOS，如-Xcomp：docs.oracle.com/javase/8/docs/technotes/tools/unix/java.html
@BillBurcham Clojure 明确清除以这种方式可能有问题的引用。我添加了一个答案来解释如何。
@BillBurcham （也许我应该在这里提到，完成这种清除的方式与尝试将参数设置为 null 的尝试不同，后者随后引入了一个新的局部变量来保持头部。Clojure在移交控制权之前清除调用者拥有的所有本地引用。最短的总结是它使用了一个辅助方法，以便它有机会传递lazySeq = null的等价物——一个赋值表达式设置@ 987654344@ 到 null - 作为调用中的一个额外参数，例如在 nth 中调用 drop 只是为了局部清除副作用。）
@BillBurcham 是的，-Xcompile 似乎是-Xcomp 的别名。我从记忆中使用它（这是一个古老的选择，很少需要），因为它有效，我没有与文档进行比较。

【解决方案2】：

Clojure 实施了一种策略来处理这种称为“本地清除”的场景。编译器支持它，使其在纯 Clojure 代码中需要时自动启动（除非在编译时禁用——这有时对调试很有用）。 Clojure 也确实在其 Java 运行时的各个地方清除了局部变量，但是，它可以在 Java 库甚至应用程序代码中使用它的方式，尽管它无疑会有些麻烦。

在深入了解 Clojure 的作用之前，先简要总结一下此示例中发生的情况：

nth(int, LazyishSeq) 是根据drop(int, LazyishSeq) 和LazyishSeq.head() 实现的。
nth 将其两个参数都传递给drop，并且不再使用它们。
drop 可以很容易地实现，避免卡住传入序列的头部。

这里nth 仍然保留它的序列参数的头部。运行时可能会丢弃该引用，但不能保证会丢弃。

Clojure 处理此问题的方式是在控制权移交给drop 之前明确清除对序列的引用。这是使用相当优雅的技巧 (link to the below snippet on GitHub as of Clojure 1.9.0) 完成的：

//  clojure/src/jvm/clojure/lang/Util.java

/**
 *   Copyright (c) Rich Hickey. All rights reserved.
 *   The use and distribution terms for this software are covered by the
 *   Eclipse Public License 1.0 (http://opensource.org/licenses/eclipse-1.0.php)
 *   which can be found in the file epl-v10.html at the root of this distribution.
 *   By using this software in any fashion, you are agreeing to be bound by
 *   the terms of this license.
 *   You must not remove this notice, or any other, from this software.
 **/

// … beginning of the file omitted …

// the next line is the 190th in the file as of Clojure 1.9.0
static public Object ret1(Object ret, Object nil){
        return ret;
}

static public ISeq ret1(ISeq ret, Object nil){
        return ret;
}

// …

鉴于上述情况，nth 内部对drop 的调用可以更改为

drop(n, ret1(lazySeq, lazySeq = null))

这里lazySeq = null在控制权转移到ret1之前被评估为一个表达式；值是null 并且还有将lazySeq 引用设置为null 的副作用。 ret1 的第一个参数将在此时进行评估，因此 ret1 在其第一个参数中接收对序列的引用并按预期返回它，然后将该值传递给 drop。

因此drop 接收到lazySeq 本地保存的原始值，但在控制权转移到drop 之前本地本身被清除。

因此nth 不再占据序列的头部。

【讨论】：

实际问题 - “泄漏”在哪里 - Holger 的回答完全解决了这个问题，但我认为这作为额外的相关信息会很有用。
我在我的测试中实现了一个ret1() 方法（例如github.com/Bill/java-garbage-test/blob/master/src/test/java/…），现在它们都可以扩展（并通过！）而不需要-Xcomp JVM 选项。我仍然认为在 Java library 中实现不可变的、惰性的、scalable 序列是不可行的。 ret1() 把戏让我们更接近（比-Xcomp）把戏。但是序列处理代码仍然很扭曲。我认为手动编写（以及调试和维护）这种代码是不可行的。