垃圾收集器
上一章介绍了垃圾回收算法,但是算法只是理论的一种可行性方案,还需要实际落地才行。于是乎,就有了好几种基于垃圾回收算法而实现的垃圾回收器。
从图中可以看出,一些算法收集器适用新生代,另一些算法收集器适用老年代。
1.Serial收集器
这是一种单线程收集器,不仅仅意味着它只会使用一个CPU或者一个收集线程去完成垃圾收集工作,更重要的是其在进行垃圾收集的时候需要暂停其他线程。
优点:简单高效,拥有很高的单线程收集效率。
缺点:收集过程需要暂停所有线程。
算法:复制算法。
2.ParNew收集器
这个收集器原理和Serial收集器差不多,只是这个支持多线程。
优点:在多CPU时,比Serial效率高。
缺点:收集过程暂停所有应用程序线程,单CPU时比Serial收集器效率差。
算法:复制算法。
3.Parallel Scavenge收集器
这个收集器原理和ParNew收集器差不多,也是支持多线程,只不过这个更关注吞吐量。
吞吐量=运行用户代码的时间/(运行用户代码的时间+垃圾收集时间)
举例:比如虚拟机总共运行了100分钟,代码运行了99分钟,垃圾收集用了1分钟,吞吐量=99/99+1=99%。
吞吐量越大,意味着垃圾收集的时间越短,用户代码可以充分利用CPU资源,尽快完成程序的运算任务。
4.Serial Old收集器
Serial Old收集器是Serial收集器的老年代版本,也是一个单线程收集器,不同的是采用标记-整理算法,运行过程和Serial收集器一样。
5.Parallel Old收集器
Parallel Old收集器是Parallel Scavenge收集器的老年代版本,使用多线程和标记-整理算法进行垃圾回收,也是注重吞吐量。
6.CMS收集器
CMS(CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。采用的是标记-清除算法,整个过程分为4步:初始标记、并发标记、重新标记、并发清除。
由于在整个过程中,并发标记和并发清除,收集器线程可以与用户线程一起工作,所以总体上来说,CMS收集器的内存回收过程是与用户线程一起并发执行的。
优点:并发收集,低停顿。
缺点:产生大量空间碎片,并发阶段会降低吞吐量。
7.G1收集器
特点:
并行与并发:G1能充分利用多CPU、多核环境下的硬件优势,使用多个CPU(CPU或者CPU核心)来缩短Stop-The-World停顿的时间,部分其他收集器原本需要停顿Java线程执行的GC动作,G1收集器仍然可以通过并发的方式让Java程序继续执行。
分代收集:与其他收集器一样,分代概念在G1中依然得以保留。虽然G1可以不需要其他收集器配合就能独立管理整个GC堆,但它能够采用不同的方式去处理新创建的对象和已经存活了一段时间、熬过多次GC的旧对象以获取更好的收集效果。
使用G1收集器时,Java堆的内存布局与就与其他收集器有很大差别,它将整个Java堆划分为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分Region(不需要连续)的集合。
空间整合:与CMS的标记-清除算法不同,G1从整体来看是基于标记-整理算法实现的收集器,从局部(两个Region之间)上来看是基于复制算法实现的,但无论如何,这两种算法都意味着G1运作期间不会产生内存空间碎片,收集后能提供连续的可用内存。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续内存空间而提前触发下一次GC。
可预测的停顿:这是G1相对于CMS的另一大优势,降低停顿时间是Gl和CMS共同的关注点,但G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒,这几乎已经是实时Java(RTSJ)的垃圾收集器的特征了。
工作过程
初始标记(Initial Marking):标记一下GC Roots能够关联的对象,并且修改TAMS的值,需要暂停用户线程。
并发标记(Concurrent Marking):从GC Roots进行可达性分析,找出存活的对象,与用户线程并发执行。
最终标记(Final Marking):修正在并发标记阶段因为用户程序的并发执行导致变动的数据,需暂停用户线程。
筛选回收(Live Data Counting and Evacuation):对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间制定回收计划。
垃圾收集器用途分类
串行收集器
Serial和Serial Old,只能有一个垃圾回收线程执行,用户线程暂停。适用于内存比较小的嵌入式设备 。
并行收集器【吞吐量优先】
Parallel Scanvenge和Parallel Old,多条垃圾收集线程并行执行,但此时用户线程仍然处于等待状态。 适用于科学计算、后台任务处理等场景。
高吞吐量可以高效的利用CPU时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。
并发收集器【停顿时间优先】
停顿时间:垃圾收集器进行垃圾回收终端应用执行响应的时间。
停顿时间越短就越适合需要和用户交互的程序,良好的响应速度能提升用户体验。
CMS和G1,用户线程和垃圾收集线程同时执行(并不一定是并行的,可能是交替执行的),垃圾收集线程在执行的时候不会停顿用户线程的运行。 适用于相对有时间要求的场景,如Web请求。