Java 内存垃圾回收

Posted by hurshi on 2019.07.30

阅读原文:咱们从头到尾说一次 Java 垃圾回收

怎么定义垃圾

引用计数算法
  • 定义:通过在对象头中分配一个空间来保存该对象被引用的次数(Reference Count)。
  • 缺点:不能解决循环引用的问题。
可达性分析算法
  • 定义:所有和 GC Roots 之间没有直接或间接引用链的对象,均为垃圾。

  • 有哪些 GC Roots呢?

    1. 虚拟机栈(栈帧中的本地变量表)中引用的对象

      1
      2
      3
      4
      5
      6
      7
      8
      9
      
      public class ClassA {
      	public ClassA(String name){}
      }
      public static void main(String[] args){
        //这里的 classA 即为 GC Root,
      	ClassA classA = new ClassA("name");
      	// 设为 null, 被回收。
        classA = null;
      }
      
    2. 方法区中类静态属性引用的对象

      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      
      public class ClassA{
      }
      public class ClassB{
        //这里的 classA 为 GC Root;
      	public static ClassA classA;
      }
      public static void main(String[] args){
      	ClassB classB = new ClassB();
      	classB.classA = new classA();
        // classB 设为 null,classB 被回收,
        // 但 classB 中的静态变量 classA 不被回收。
        classB = null;
      }
      
    3. 方法区中常量引用的对象

    4. 本地方法栈中 JNI(即一般说的 Native 方法)引用的对象

如何回收垃圾

标记清除算法

  • 逻辑:先把内存区域中的这些对象进行标记,哪些属于可回收标记出来,然后把这些垃圾拎出来清理掉。就像上图一样,清理掉的垃圾就变成未使用的内存区域,等待被再次使用。
  • 缺点:造成内存碎片。
复制算法

  • 逻辑:将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。保证了内存的连续可用,内存分配时也就不用考虑内存碎片等复杂情况,逻辑清晰,运行高效。
  • 缺点:暴露了另一个问题,合着我这140平的大三房,只能当70平米的小两房来使?代价实在太高。
标记整理算法

  • 逻辑:标记过程仍然与标记清除算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,再清理掉端边界以外的内存区域
  • 缺点:它对内存变动更频繁,需要整理所有存活对象的引用地址,在效率上比复制算法要差很多。
分代收集算法

  • 逻辑:融合上述3种基础的算法思想,把 Java 堆分为新生代老年代:

    • 在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法。
    • 在老年代中,因为对象存活率高、没有额外空间对它进行分配担保,就必须使用标记清除算法标记整理算法来进行回收。老生代只有在 Major GC 的时候才会进行清理,每次 GC 都会触发“Stop-The-World”。内存越大,STW 的时间也越长,所以内存也不仅仅是越大就越好。
  • 新生代分区:

    1. Eden区:Minor GC 之后,Eden 会被清空,Eden 区中绝大部分对象会被回收,而那些无需回收的存活对象,将会进到 Survivor 的 From 区
    2. Survivor 区相当于是 Eden 区和 Old 区的一个缓冲,类似于我们交通灯中的黄灯。Survivor 又分为2个区,一个是 From 区,一个是 To 区。每次执行 Minor GC,会将 Eden 区和 From 存活的对象放到 Survivor 的 To 区。
    3. 为啥 Survivor 需要需要2个? 其实 Survivor 采用的是上文所说的复制算法,第一次GC的时候,将 From 中存活的复制到 To 中,第二次GC的时候 From 和 To 指责对调。
  • 大对象:直接进入老生代,避免在 Eden 及2个 Survivor 区之间进行大量的内存复制。

  • 长期存活对象:虚拟机给每个对象定义了一个对象年龄(Age)计数器。正常情况下对象会不断的在 Survivor 的 From 区与 To 区之间移动,对象在 Survivor 区中每经历一次 Minor GC,年龄就增加1岁。当年龄增加到15岁时,这时候就会被转移到老年代。

  • 动态对象年龄:虚拟机并不重视要求对象年龄必须到15岁,才会放入老年区,如果 Survivor 空间中相同年龄所有对象大小的总合大于 Survivor 空间的一半,年龄大于等于该年龄的对象就可以直接进去老年区,无需等你“成年”。