【后端面经-Java】JVM垃圾回收机制

端面,java,jvm,垃圾,回收,机制 · 浏览次数 : 269

小编点评

**JVM和垃圾回收机制** **JVM** Java虚拟机(JVM)是运行Java应用程序的核心部分,负责内存管理、垃圾回收等工作。 **垃圾回收机制** 垃圾回收机制是JVM负责回收垃圾对象的机制,它会根据内存剩余的比例分配垃圾回收内存。 **触发机制/判断算法** 垃圾回收机制的触发机制和判断算法会在JVM中进行。常见的有如下机制: * **\"where\"**:根据内存中某个对象的"where"属性进行判断。 * **\"which\"**:根据内存中某个对象的"which"属性进行判断。 * **\"when\"**:根据内存中某个对象的"when"属性进行判断。 * **\"why\"**:根据内存中某个对象的"why"属性进行判断。 * **\"how\"**:根据内存中某个对象的"how"属性进行判断。 * **\"who\"**:根据内存中某个对象的"who"属性进行判断。 **垃圾回收算法** 垃圾回收算法主要包括以下步骤: * **标记**:将内存中所有对象标记为垃圾回收。 * **回收**:从垃圾回收内存中回收所有标记为垃圾回收的对象。 * **整理**:根据垃圾回收算法的结果,整理内存碎片。 **垃圾回收器** 垃圾回收器是JVM负责回收垃圾对象的线程,它会在内存剩余的比例中分配垃圾回收内存。 **并发操作** 为了提高垃圾回收效率,JVM会在垃圾回收过程中进行并发操作,例如: * **并发标记**:多个线程可以并发地标记内存中对象为垃圾回收。 * **并发回收**:多个线程可以并发地回收内存中的对象。 * **并发整理**:多个线程可以并发地整理内存碎片。 **停顿预测模型** 用户可以设置垃圾回收停顿时间,而G1回收器会根据历史数据构建预测模型,考虑为了满足用户设置的停顿时间,本次垃圾回收可以处理哪几个Region。

正文

1. Where:回收哪里的东西?——JVM内存分配

JVM垃圾回收机制(Garbage Collect,简称GC)主要负责回收JVM内存当中未被及时释放回收的内存区域,JVM垃圾回收机制让程序员摆脱了手动释放内存的操作,降低了程序员疏忽大意导致的风险。
那么,垃圾回收机制到底针对哪一块的内存空间进行处理呢?是整体内存还是某一块内存?
在回答这个问题之前,我们需要先了解一下JVM内存分配机制,JVM内存分配机制主要有如下几个区域:

  • 栈(Stack)
  • 堆(Heap)
  • 方法区(Method Area)
  • 本地方法栈(Native Method Stack)
  • 程序计数器(PC)
    我们需要知道的是,栈、本地方法栈、程序计数器和方法调用有关,是线程私有的,随着方法结束,栈和本地方法栈的栈帧会出栈,释放内存,因此,这三部分并不需要使用垃圾回收机制。
    而堆主要存放对象实例和数组,而方法区存放类的信息、编译信息、常量池等,这两块区域由于是线程共享的,在方法调用结束之后也不会被释放内存(毕竟A用完了,不知道B、C、D会不会用到这部分)需要使用垃圾回收机制进行内存回收。

关于每个区域的具体内容,可参考博客:【后端面经-Java】JVM内存分区详解

因此,内存回收机制主要针对堆和方法区进行处理。

2. Which:内存对象中谁会被回收?——GC分代思想

2.1 年轻代/老年代/永久代

JVM垃圾回收机制中,一般都是基于GC分代思想进行算法设计。
GC机制将内存内容分为三部分:

  • 年轻代(Young Generation):新产生的实例基本上都处于这代,因为新产生的实例大部分都是一次性的,因此这部分内存需要经常进行内存回收;
  • 老年代(Old Generation):在新生代残酷频繁的筛选机制中,多次存活下来的实例会进入老年代,老年代意味着生命周期较长,一般在内存没有满之前不会对这部分内存进行回收;
  • 永久代(Permanent Generation,JCK1.8之后改成元空间(Metaspace)):永久代存放的是JVM程序运行相关的元数据,比如类信息、方法信息、常量池等,内容重要且占空间小,因此基本上不会进行垃圾回收。

如果要类比的话,年轻代就是刚刚步入职场的小青年,不稳定性较高,很容易被裁员(垃圾回收),而熬过这个阶段,成为技术骨干(老年代)之后,基本上不会在正常公司运行过程中被裁员,除非公司倒闭(内存已满),而永久代或者元空间就是公司最高层的管理人员,对公司的运行起着关键作用,一般情况下不会被裁员。

2.2 内存细分

  1. 堆和方法区
    堆中存放年轻代和老年代,而方法区中存放永久代。
  2. 新生代区域细分
    新生代区域又分为Eden区Survivor0区Survivor1区,比例为8:1:1

整体内存细分情况如图所示:

3. When:什么时候回收垃圾?——GC触发条件

GC按照触发条件,可分为Scavenge GCFull GC

  • Scavenge GC(Minor GC)
    Scavenge GC是指年轻代Eden区的垃圾回收,触发条件为:
    • 年轻代Eden区域内存不足
      • 调用Scavenge GC之后,将未清理的元素放入Survivor0区域。如果Survivor0区域内存不足,则将Survivor0区域内存中的所有元素放入Survivor1区域。清空Survivor0区域,然后将Survivor1中的元素放入Survivor0中;
      • 如果Survivor1区域内存不足,则将Survivor1区域内存中的所有元素放入老年代中;
      • 如果老年代也内存不足,则会考虑触发Full GC。
  • Full GC(Major GC)
    Full GC是整体对内存的垃圾回收,包括年轻代和老年代,触发条件为:
    • 老年代内存不足
    • 永久代内存不足
    • 显性调用system.gc()
    • 上次GC之后堆内存的划分出现变化

对于GC线程,其本身的优先级比较低,因此在CPU空闲的时候,可能会进行GC处理,而在忙时基本上不会进行GC处理,除非此时内存空间不足,需要GC处理之后才能正常运行。
Full GC对于计算资源是一个很大的消耗,应该尽量避免使用Full GC。

4. Why:凭什么说它是垃圾?——垃圾判断算法

前面主要介绍了JVM垃圾回收机制的针对对象,GC分代思想和触发条件。那么,好好的一个对象实例,GC机制空口无凭凭什么说它是垃圾呢?这就需要垃圾判断算法了。
常见的垃圾判断方法有两种:引用计数法可达性分析法

4.1 引用计数法

  • 每个对象实例都有一个引用计数器,当有一个引用指向该对象实例时,引用计数器加1,当引用失效时,引用计数器减1,当引用计数器为0时,该对象实例就是垃圾,需要进行回收。
  • 补充一下JVM的引用类型,如下图所示:
  • 优点:判断逻辑简单;
  • 缺点:无法解决循环引用的问题(从图论角度来说就是环状节点无法识别)。

4.2 可达性分析法

  • 将每个实例看作节点,两个实例之间的引用关系看作路径。从GC Roots开始,对堆内存中的对象进行遍历,如果某个对象实例没有被遍历到,则说明该对象实例不可达,不可达则是垃圾,对其进行垃圾标记,等待后续回收(非连通图查找连通子图的数量)。
  • GC Roots指的是正在运行的程序中一些基本对象,从这些对象往下查找其引用对象,包括如下几种:
    • 虚拟机栈(栈帧中的本地变量表)中引用的对象
    • 方法区中类静态属性引用的对象
    • 方法区中常量引用的对象
    • 本地方法栈中JNI(Native方法)引用的对象
  • 优点:能有效解决循环引用的问题;
  • 缺点:判断逻辑复杂,需要遍历整个内存空间,效率较低。

5. How:如何对待垃圾?——垃圾回收算法

常见的垃圾回收算法包括:标记-清除算法标记-整理算法复制算法分代收集算法(自适应算法)。

5.0 垃圾的垂死挣扎

在被处决之前,垃圾会进行一次垂死挣扎,实例第一次被标记为垃圾之后,如果可以进行一次有效finalize()方法调用,和其他实例建立引用,那么该实例就会被复活,不会被回收。

5.1 标记-清除算法

在垃圾判断算法执行完成后,已经被明确判断成垃圾的实例,清除法在原地释放其内存空间,将其标记为可用空间,等待后续的内存分配。

  • 优点:操作简单,原地清除不需要复制内存
  • 缺点:会产生内存碎片,长期运行会影响CPU运行效率

5.2 标记-整理算法

标记-整理算法在标记完成之后,将所有存活的实例移动到一端,然后清除掉另一端的内存空间,这样就可以有效解决内存碎片的问题。

  • 优点:无内存碎片;
  • 缺点:需要移动实例,效率较低;

5.3 复制算法

复制算法将内存空间分为两块,每次只使用其中一块,当一块内存空间内存满了之后,将存活的实例复制到另一块内存空间中,然后清除掉之前的内存空间。

  • 优点:无内存碎片,操作简单;标记和复制可并行;
  • 缺点:可用内存空间直接减半,内存利用率较低;

5.4 分代收集算法

针对不同代的数据特点,使用不同的垃圾回收算法。

  • 年轻代:复制算法
    • 存活对象较少,复制算法每次的对象复制不会有太大负担;
    • 操作频繁,复制算法标记和复制可并发处理,效率较高;
  • 老年代:标记-整理算法
    • 存活对象较多,减少内存碎片,提高可用性
  • 永久代(元空间):不作考虑

6. Who:谁去处理垃圾?——垃圾回收器

垃圾回收器是垃圾回收算法的执行者,常见的垃圾回收器如下图所示:

连线部分说明这两个垃圾回收器能够搭配使用。

6.1 年轻代-Serial收集器

  • 回收算法:复制算法
  • 单线程:执行回收算法的时候是单线程;适用于并发能力较低的系统。
  • Stop the World:一般线程和回收线程无法并行,执行回收算法需要中断其他线程,这个现象称为Stop the World(乱入Dio的“咋瓦鲁多”)。
    • Stop the World现象会导致系统暂停,引出垃圾收集停顿时间这一参数,影响用户体验,因此需要尽量避免;
  • 优点:简单高效,适用于单核CPU;
  • 缺点:无法并行,且单线程处理效率较低;
  • 启用方式:-XX:+UseSerialGC

6.2 年轻代-ParNew收集器

  • 回收算法:复制算法
  • 多线程:执行回收算法的时候是多线程;
  • 也会存在Stop the World现象,除了多线程的改进之外,和Serial收集器没有太大区别;
  • 优点:多线程处理效率高,适用于多核CPU;
  • 缺点:一般线程和回收线程无法并行处理;
  • 启用方式:-XX:+UseParNewGC

6.3 年轻代-Parallel Scavenge收集器

  • 回收算法:复制算法
  • 关注吞吐量
    吞吐量 = 用户线程运行时间 / (用户线程运行时间 + 垃圾回收线程运行时间)
    
  • 相关参数
      1. 垃圾收集停顿时间
      • 设置方式:-XX:MaxGCPauseMillis=一个数值
      • 停顿时间过大将会直接影响每次垃圾回收的用户体验,停顿时间过小则会导致垃圾回收频繁;
      1. 吞吐量大小
      • 设置方式:-XX:GCTimeRatio=一个数值
      • 默认取值为99%,表示只有1%的时间用于垃圾回收;
      1. 自适应模式
      • 设置方式:-XX:+UseAdaptiveSizePolicy
      • 设置自适应模式之后,内存中的新生代分配比例和老年代的时间参数可自行调整,达到吞吐量、停顿时间和内存占用的平衡;
  • 是JDK1.8的默认垃圾回收器
  • 启用方式:-XX:+UseParallelGC

6.4 老年代-SerialOld收集器

  • 回收算法:标记-整理算法
  • 单线程,可类比年轻代的Serial收集器,优缺点同理
  • CMS收集器的后备算法

6.5 老年代-ParallelOld收集器

  • 回收算法:标记-压缩算法
  • 关注吞吐量,可类比年轻代的Parallel Scavenge收集器
  • 多线程,线程数通过-XX:ParallelGCThreads设置,默认为CPU核心数
  • 启用方式:-XX:+UseParallelOldGC

6.6 老年代-CMS(Concurrent Mark Sweep)收集器

  • 回收算法:标记-清除算法
  • 关注停顿时间,期望有较短的垃圾回收停顿时间,从而优化用户体验;
  • 回收步骤:
    • 初始标记:适用可达性分析法的思想,标记GC Roots能直接关联到的对象,速度较快;
    • 并发标记:一般线程和回收线程并行,对此时标记状态出现变化的实例进行统计;
    • 重新标记:根据并发标记的结果,对标记状态发生变化的实例进行重新标记,这一步相对较慢;
    • 并发清除:清理垃圾实例,释放内存空间;这一步可以和一般线程并行;
  • 相关参数:
    • 触发阈值:
      • 设置方式:-XX:CMSInitiatingOccupancyFraction=一个数值
      • 和之前讨论的何时进行垃圾回收的触发机制不同,CMS在处理老年代的时候,不会等到内存完全占满,而是会设置一个阈值,默认数值为68%,占用内存空间超过这个阈值就进行垃圾回收处理。
    • 整理标记
      • 设置方式:-XX:+UseCMSCompactAtFullCollection
      • 如果设置这一标记,则垃圾回收之后会进行一次整理,合并内存碎片。
  • 优点:并发收集,提高执行效率;减少停顿时间,用户体验佳
  • 缺点:无法处理浮动垃圾,对CPU资源敏感,且标记清除算法会产生内存碎片

6.7 年轻代和老年代-G1(Garbage First)收集器

  • 回收算法:整体来看是标记-整理算法,局部来看是复制算法
  • 关注停顿时间,也关注高吞吐量(我全都要.jpg);
  • 分区:不同于之前所讨论的分代划分内存区域的方式,G1回收器将内存划分为一个又一个单元区域,称为Region
    • 设置方式:-XX:G1HeapRegionSize=一个数值
    • 每个分区内部可以存放年轻代或者老年代的数据,根据不同的存放数据,将分区划分为四类:
      • E-Eden区:存放年轻代当中Eden区域的数据;
      • S-Survivor区:存放年轻代当中Survivor区域(survivor0和survivor1)的数据;
      • O-Old:存放老年代的一般数据;
      • H-Humongous:存放老年代当中大对象的数据;当占据整个Region一半以上的时候,就会被划分为Humongous区域;
  • 停顿预测模型:用户可以自行设置垃圾回收停顿时间,而G1回收器会根据历史数据构建预测模型,考虑为了满足用户设置的停顿时间,本次垃圾回收可以处理哪几个Region。
  • Region优先级队列:G1浏览器维护一个Region队列,高价值的Region有更高的优先级,在垃圾回收的时候优先处理,这也是Garbage First名字的由来。
  • 回收步骤(和CMS回收器类似):
    • 初始标记
    • 并发标记
    • 重新标记
    • 并发清除
  • 优点:并发操作,并行收集,提高执行效率;关注停顿时间,可预测停顿时间,优化用户体验;可处理浮动垃圾,不会产生内存碎片;

6.8 垃圾回收器对比图

对上述垃圾回收器的对比如下所示:

面试模拟

Q:介绍一下JVM和垃圾回收机制。
A:从"where"、"which"、"when"、"why"、"how"、"who"的角度,重点介绍触发机制/判断算法/垃圾回收算法/垃圾回收机制

参考资料

  1. JVM之垃圾回收机制(GC)
  2. JVM的垃圾回收机制 总结(垃圾收集、回收算法、垃圾回收器)
  3. 深入理解 JVM 垃圾回收机制及其实现原理

与【后端面经-Java】JVM垃圾回收机制相似的内容:

【后端面经-Java】JVM垃圾回收机制

本文对JVM垃圾回收机制做了详细解释,从"where"、"which"、"when"、"why"、"how"、"who"的角度,重点介绍JVM垃圾回收机制的触发机制、垃圾判断算法、垃圾回收算法和垃圾回收机制。

【后端面经-Java】JVM内存分区详解

本文主要介绍了JVM内存分区的基本情况,着重介绍了栈、堆、方法区的分区情况,并给出实际代码解释内存分配的过程。

【后端面经-Java】Java创建线程的方法简介

本文简要介绍了java中创建线程的四种方式,并介绍了线程概念,适合新手阅读。

【后端面经-java】java线程池满的处理策略

本文对java线程池做了具体介绍,并且讨论了java线程池满了之后的拒绝策略。

【后端面经-Java】HashMap详解

本文详细介绍了hashmap,包括基本概念、hashmap数据结构、关键变量和重要方法,并且结合源码进行分析。

【后端面经-Java】Synchronize和ReentrantLock区别

本文介绍了Synchronize和ReentrantLock同步锁的相似和不同点,并指出两者的主要特点和适用场景。

【后端面经-Java】AQS详解

本文介绍了AQS的核心思想、基本架构、实现方法,并对框架中的重要源码方法进行介绍和分析

【后端面经-Java】公平锁和加锁流程

本文主要介绍了公平锁和非公平锁的概念和区别,并且结合Reentranslock锁的源码对加锁机制进行分析。

【后端面经-Java】I/O多路复用 简录

本文主要介绍了Java当中常见的几种IO模型,介绍其运行机制和实际缺点,并进行技术对比,对于IO多路复用的实现方式进行分析。

【后端面经-Java】String与StringBuffer与StringBuilder的比较

本文从String、StringBuffer、StringBuilder三者的特性出发,详细介绍三者的不同之处。