垃圾收集器及内存分配策略

文章目录

1 对象已死吗（什么时候进行垃圾回收？）

1.1引用计数
1.2可达性分析算法
1.3 死还是不死
1.4 回收方法区

2 垃圾收集算法

2.1 标记-清除算法
2.2 复制算法
2.3 标记-整理算法
2.4 分代收集算法

3 hotSpot算法的实现
4 垃圾收集器

4.1 Serial收集器
4.2 ParNew收集器
4.3 Parallel Scavenge收集器
4.4 Serial Old 收集器
4.5 Parallel Old 收集器
4.6 CMS收集器
4.7 G1收集器

垃圾收集在java产生之前就有了。垃圾收集要考虑如下三个问题：

哪些内存进行垃圾回收？

什么时候进行垃圾回收？

怎样进行垃圾回收？

哪些内存要进行垃圾回收？

首先java虚拟机栈（栈）、程序计数器、本地方法栈，这三个内存区域随线程而生，随线程而死，并且每一个栈帧需要分配多少内存空间在类结构确定（类加载）之后就明确了。由于这三个区域的内存分配和回收具有确定性，所以他们的内存回收不需要太多考虑。

然而，堆、方法区内存的分配和回收都是动态的（要分配哪些对象只有在程序运行时才知道），所以 垃圾收集器关注的这这部分内存 ，本章后面所说的内存，指的就是这部分内存。

顺便补充一下，java虚拟机栈（栈）和堆的区别：

垃圾收集器关注的是堆，而不关注栈

栈存的是局部变量表、对象的引用、操作数栈、动态链接等，而堆存的是对象的实例

1 对象已死吗（什么时候进行垃圾回收？）

判断对象是否可用有两种方式：引用计数、可达性分析算法。

1.1引用计数

引用计数有一个缺点，那就是循环引用。JavaScript中的引用计数也存在这种问题。并且实际上，主流的虚拟机都采用那个可达性分析算法。

1.2可达性分析算法

思想：从一系列被称为GC Roots的对象开始向下搜索对象，搜索产生的路径称为 引用链 ，当对象和GC Roots之间没有这样的引用链时，证明这个对象不可用。

可作为GC Roots的对象如下：

虚拟机栈中所引用的对象

方法区中类静态属性引用的对象

方法区中常量（运行时常量池）所引用的对象

本地方法栈中（Native方法）所引用的对象

1.3 死还是不死

上面的引用计数和可达性分析算法只能判断对象可用还是不可用，不可用是相当与对对象判了缓刑。要决定对象死还是不死至少要经历两次标记过程（两次可达性分析）：

如果对象进行可达性分析时不存在引用链，它将会被标记一次并进行筛选，筛选的条件是是否有必要执行finalize()方法（当对象已经执行了一次finalize方法或者没有重新finalize方法时，就没必要了），当在finalize()中，对象被拯救了，也就是又被其他引用指向了，那么在第二次标记中它会被移出“即将回收“集合。

注意：finalize（）方法只允许被调用一次（只能有gc调用，不要有对象自身调用），并且不要使用finalize，这只是为让C++程序员使用java的一种妥协。

1.4 回收方法区

方法区（永生待）的垃圾收集主要是两部分：废弃常量、无用的类。
判断无用的类的标准：

该类所有的实例都已经被回收

加载该类的类加载器（ClassLoader）已经被回收

该类对应的java.lang.Class对象没有引用指向

2 垃圾收集算法

2.1 标记-清除算法

标记-清除算法存在两点不足：

标记和清除过程效率不高

空间问题，清除后可能会产生大量不连续的内存空间

垃圾收集器及内存分配策略

2.2 复制算法

这个方法适用于对象存活率低的内存空间。

将内存空间分为两块，当一块的内存使用完后，将其中存活的对象移到另一块内存空间中，清空上一块内存空间。缺点是，空间利用率不高。

垃圾收集器及内存分配策略

研究表明，堆中新生代98%的对象是朝生幕死的，所以将新生代划分为 一个Eden、两个Survivor 。当一个Eden和一个Survivor的内存使用完后，就将其存活对象复制到另一个Survivor中。当然，当另一个Survivor内存不够时，就要使用到堆的老年代了。

2.3 标记-整理算法

这个方法适用于对象存活率高的空间（老年代）

这个方法和标记-清理算法一样，只不过第二个过程整理是将存活的对象往一段移动，然后清空边界以外的内存空间。

垃圾收集器及内存分配策略

2.4 分代收集算法

这是当前商业虚拟机采用的垃圾收集算法。

将堆分为新生代，老年代。新生代采用复制算法，老生代采用标记-清理算法或标记-整理算法。

3 hotSpot算法的实现

枚举根节点（GC roots）

由于方法区一般很大，所以需要OOP数据结构来指明哪里有对象引用引用。当然在执行gc时，要保证引用链不能被改变，于是就有了 gc停顿 （中断所以的java线程）

安全点（safe point）

线程执行时，并非让gc可以在程序的任意一个地方进行gc停顿。只有到达安全点（指令复用，方法调用，循环跳转，异常跳转）才能进行gc停顿。

到达安全点，进行gc停顿的方式有两种：枪先式中断、主动时中断

安全区域（safe range）

当线程发生阻塞时，它是不会响应中断的。因此，我就让阻塞时间内执行的代码区域称为 安全区域 。当发生gc停顿时，gc是不管把自己标记为Safe range 状态的线程的。当线程要离开safe range状态时，要先判断gc过程（枚举根节点）是否已经完成，总之直到gc过程完成后，线程才可以从阻塞状态继续执行。

4 垃圾收集器

如果说内存收集算法是内存回收的方法论，那么垃圾收集器就是内存的具体实现。下面图上有连线的表示可用配合使用。
垃圾收集器及内存分配策略

4.1 Serial收集器

Serial收集器只会使用一个cpu或一条收集线程区进行垃圾回收。并且在它进行垃圾回收时，必须暂停所有工作线程，直到它结束。

垃圾收集器及内存分配策略

优点是：简单高效。

4.2 ParNew收集器

可以说它是Serial收集器的多线程版本，除了使用多线程进行垃圾回收之外，其余的控制行为、垃圾收集算法、对象分配规则都和Serial收集器一样。

4.3 Parallel Scavenge收集器

Parallel Scavenge收集器是多线程的，采用复制算法的新生代收集器。它关注的是尽可能让程序的吞吐量（运行用户代码时间/（运行用户代码时间+垃圾收集时间））大。所以这个收集器适合用于在后台运行的与用户交互少任务。可以设置-XX:UseAdaptiveSizePolizy来开启GC自适应收集策略（它会提供一个最好的吞吐量，并且这个是它与ParNew的一个重要区别）。

4.4 Serial Old 收集器

它是一个Serial收集器的老年代版本。采用的是标记-整理算法。

4.5 Parallel Old 收集器

它是Parallel Scavenge收集器的老年代版本。使用多线程和“标记-整理算法”。

4.6 CMS收集器

CMS收集器是一种获得最短停顿时间的收集器。它分为如下4个步骤：

初始标记：初始标记和重新标记都需要暂停所有工作任务。初始标记仅仅只标记GC Roots直接关联的对象。

并发标记：进行GC Roots tracing的过程。

重新标记：用于标记并发标记期间，由于用户程序继续运作而导致的标记变动的那一部分对象。

并发清除：清除对象

从总体来说，CMS的内存回收过程是与用户线程一起执行的。

垃圾收集器及内存分配策略

CMS收集器的优点：并发收集、低停顿。
CMS收集器的缺点：对内存空间比较敏感、会产生大量空间碎片、无法收集浮动垃圾。

4.7 G1收集器

它是一款面向服务器端的收集器。与其他GC收集器相比，有如下特点：

并发并行

分代收集

空间整合（标记-清理算法）

停顿时间可预测

它有四个步骤：初始标记、并发标记、最终标记、筛选回收。
垃圾收集器及内存分配策略