GC 알고리즘 가비지 컬렉터
개요
가비지 컬렉션 가비지 컬렉션은 흔히 "GC"라고 불리며 1960년 MIT의 Lisp 언어로 탄생했습니다. 현재는 이미 매우 성숙했습니다.
jvm에서는 프로그램 카운터, 가상 머신 스택 및 로컬 메소드 스택이 모두 스레드로 생성 및 소멸되므로 메소드가 들어오고 나갈 때 스택 프레임이 푸시되고 팝되므로 자동 메모리 정리가 실현됩니다. , 우리의 메모리 가비지 수집은 주로 Java 힙 및 메소드 영역에 집중되어 있습니다. 프로그램 실행 중에 이 메모리 부분의 할당 및 사용은
객체 생존 판단입니다.
객체가 살아 있는지 판단하는 방법에는 일반적으로 두 가지가 있습니다.
참조 카운팅: 각 객체에는 참조 카운트 속성이 있으며, 참조가 추가되면 카운트가 1씩 증가합니다. 참조가 해제되면 1을 빼고, 0이 되면 재활용할 수 있습니다. 이 방법은 간단하며 객체가 서로 순환적으로 참조하는 문제를 해결할 수 없습니다.
접근성 분석: GC Roots에서 아래쪽으로 검색하며, 검색이 이동한 경로를 참조 체인이라고 합니다. 객체에 GC 루트에 연결된 참조 체인이 없으면 해당 객체를 사용할 수 없음을 증명합니다. 연결할 수 없는 개체입니다.
Java 언어에서 GC 루트에는 다음이 포함됩니다.
가상 머신 스택에서 참조되는 개체입니다.
메소드 영역에서 클래스 정적 속성 엔터티가 참조하는 객체입니다.
메소드 영역에서 상수가 참조하는 객체입니다.
로컬 메서드 스택에서 JNI가 참조하는 개체입니다.
가비지 수집 알고리즘
Mark-Sweep 알고리즘
"Mark-Sweep" 알고리즘은 이름 그대로 두 단계로 나누어집니다. : "마킹" 및 "지우기": 먼저 재활용이 필요한 모든 객체를 표시하고, 마킹이 완료되면 표시된 모든 객체를 균일하게 재활용합니다. 가장 기본적인 수집 알고리즘이라고 불리는 이유는 이후의 수집 알고리즘이 이러한 아이디어를 바탕으로 단점을 개선하기 때문이다.
주요 단점은 두 가지입니다. 하나는 효율성 문제이고, 다른 하나는 표시 및 삭제 후 많은 수의 불연속적인 메모리 조각이 생성된다는 것입니다. , 그리고 공간 조각화가 너무 큽니다. 이로 인해 프로그램이 나중에 더 큰 개체를 할당해야 하고 다른 가비지 수집 작업을 미리 트리거해야 할 때 충분한 연속 메모리를 찾을 수 없게 될 수 있습니다.
복사 알고리즘
사용 가능한 메모리를 용량에 따라 동일한 크기의 두 블록으로 나누는 복사(Copying) 수집 알고리즘, 매번 하나만 사용 이 조각들 중. 이 메모리 블록이 부족해지면 살아남은 객체를 다른 블록에 복사한 후, 사용한 메모리 공간을 한꺼번에 정리하세요.
이렇게 하면 매번 메모리 한 조각이 재활용되므로 메모리 조각화 등 복잡한 상황을 고려할 필요 없이 힙의 최상위 포인터를 이동하여 순서대로 메모리를 할당하면 됩니다. 구현이 간단하고 효율적으로 실행됩니다. 단지 이 알고리즘의 비용은 메모리를 원래 크기의 절반으로 줄이는 것이며 수명이 긴 객체를 계속 복사하면 효율성이 저하됩니다.
마크 압축 알고리즘
복사 수집 알고리즘은 개체 생존율이 높을 때 더 많은 복사 작업을 수행하므로 효율성이 떨어집니다. 더 중요한 것은 공간의 50%를 낭비하지 않으려면 사용된 메모리의 모든 객체가 100% 살아 있는 극단적인 상황을 처리하기 위해 할당 보장을 위한 추가 공간이 필요하다는 것입니다. 이전 세대 알고리즘에서는 직접 사용할 수 없습니다.
구세대의 특성에 따라 누군가가 또 다른 "Mark-Compact" 알고리즘을 제안했습니다. 마킹 프로세스는 여전히 "Mark-Compact" 알고리즘과 동일하지만 후속 단계는 직접적인 관련이 없습니다. 객체는 정리되지만 살아남은 객체는 모두 한쪽 끝으로 이동한 다음 끝 경계 외부의 메모리를 직접 정리합니다.
세대별 수집 알고리즘
GC 생성의 기본 가정: 대부분의 개체의 수명 주기는 매우 짧고 생존 시간도 짧습니다.
"세대 컬렉션" 알고리즘은 Java 힙을 신세대와 구세대로 나누어 각 세대의 특성에 따라 가장 적합한 컬렉션 알고리즘을 사용할 수 있도록 해줍니다. 새로운 세대에서는 가비지 컬렉션을 수행할 때마다 수많은 개체가 죽은 것으로 확인되고, 그 중 소수만이 살아남는다. 그러다가 복사 알고리즘을 사용하게 되며, 복사 비용을 지불해야만 컬렉션을 완료할 수 있다. 소수의 살아남은 개체. Old 세대에서는 객체 생존율이 높고 할당을 보장할 추가 공간이 없기 때문에 재활용을 위해 "mark-clean" 또는 "mark-clean" 알고리즘을 사용해야 합니다.
가비지 컬렉터
컬렉션 알고리즘이 메모리 재활용 방법론이라면 가비지 컬렉터는 메모리 재활용의 구체적인 구현입니다.
직렬 수집기
직렬 수집기는 가장 오래되고 가장 안정적이며 효율적인 수집기입니다. 긴 일시 중지가 발생할 수 있으며 수집하는 데 하나의 스레드만 사용됩니다. 신세대와 구세대는 직렬 재활용을 사용합니다. 신세대 복사 알고리즘, 구세대 마크 압축, Stop The World(서비스 중단)는 가비지 수집 중에 중지됩니다.
매개변수 제어: -XX:+UseSerialGC Serial Collector
ParNew Collector
ParNew Collector는 실제로 Serial Collector의 멀티스레드 버전입니다. 신세대 병렬, 구세대 직렬, 신세대 복사 알고리즘, 구세대 마크 압축
매개변수 제어: -XX:+UseParNewGC ParNew 컬렉터
-XX:ParallelGCThreads 스레드 수 제한
Parallel Collector
Parallel Scavenge Collector는 ParNew Collector와 유사하며, Parallel Collector는 시스템 처리량에 더 중점을 둡니다. 적응형 조정 전략은 매개변수를 통해 활성화될 수 있습니다. 가상 머신은 시스템의 현재 작동 조건을 기반으로 성능 모니터링 정보를 수집하고 이러한 매개변수를 동적으로 조정하여 가장 적절한 일시 중지 시간 또는 최대 처리량을 제공할 수도 있습니다. 초과하지 않도록 매개변수를 통해 제어됨, 신세대 복사 알고리즘, 구세대 표시 압축
매개변수 제어: -XX:+UseParallelGC 병렬 수집기 + 구세대 직렬 사용
Parallel Old Collector
Parallel Old는 멀티 스레딩 및 "마크 정렬" 알고리즘을 사용하는 Parallel Scavenge Collector의 구세대 버전입니다. 이 수집기는 JDK 1.6에서
매개변수 제어만 제공하기 시작했습니다. -XX:+UseParallelOldGC 병렬 수집기 + 이전 세대 병렬 사용
CMS 수집기
CMS(Concurrent Mark Sweep) 수집기는 가장 짧은 재활용 휴지 시간을 얻는 것을 목표로 하는 수집기입니다. 현재 Java 애플리케이션의 대부분은 인터넷 웹사이트나 B/S 시스템의 서버에 집중되어 있습니다. 이러한 애플리케이션은 서비스의 응답 속도에 특히 주의를 기울이고 있으며, 시스템 정지 시간을 최대한 단축하여 사용자에게 제공할 수 있기를 바랍니다. 더 나은 경험.
이름("Mark Sweep" 포함)에서 알 수 있듯이 CMS 컬렉터는 "mark-sweep" 알고리즘을 기반으로 구현되었으며 이전 컬렉터보다 작동 프로세스가 더 복잡합니다. 전체 프로세스는
초기 표시(CMS 초기 표시)
동시 표시(CMS 동시 표시)
비고(CMS 주석)
CMS 동시 스윕
초기 표시와 재표시의 두 단계에는 여전히 "Stop The World"가 필요합니다. 초기 마킹은 GC Roots가 직접 연관시킬 수 있는 객체만을 표시하며 속도가 매우 빠릅니다. 동시 마킹 단계는 GC Roots Tracing 과정이고, 재마킹 단계는 사용자 프로그램이 계속해서 발생하는 마킹을 수정하는 단계입니다. 변경된 객체 부분의 마킹 기록에 대해 이 단계의 휴지 시간은 일반적으로 초기 마킹 단계보다 약간 길지만 동시 마킹 시간보다 훨씬 짧습니다.
전체 프로세스에서 가장 긴 동시 표시 및 동시 지우기 프로세스 동안 수집기 스레드는 사용자 스레드와 함께 작업할 수 있으므로 일반적으로 CMS 수집기의 메모리 재활용 프로세스는 사용자 스레드 구현과 동시에 수행됩니다. Old Generation Collector (신세대에서는 ParNew를 사용)
장점 : 동시 수집, 낮은 Pause
단점 : 공간 조각화가 많이 발생하고, 동시 단계로 인해 처리량이 감소
매개변수 제어 :-XX:+UseConcMarkSweepGC CMS 수집기 사용
-XX:+ UseCMSCompactAtFullCollection 전체 GC 후에 조각 모음을 수행합니다. 조각 모음 프로세스는 배타적이며 일시 중지 시간이 길어집니다.
-XX :+CMSFullGCsBeforeCompaction 여러 Full GC 후 조각 모음을 수행하도록 설정
-XX:ParallelCMSThreads CMS 스레드 수 설정(일반적으로 사용 가능한 CPU 수와 동일)
G1 Collector
G1은 현재 기술 개발의 가장 최첨단 성과 중 하나입니다. HotSpot 개발팀이 G1에 부여한 임무는 향후 JDK1.5에서 출시되는 CMS 컬렉터를 대체하는 것입니다. . CMS 컬렉터와 비교하여 G1 컬렉터는 다음과 같은 특징을 가지고 있습니다:
1. 공간 통합 G1 컬렉터는 마크 정렬 알고리즘을 사용하며 메모리 공간 조각화를 생성하지 않습니다. 큰 객체를 할당할 경우 연속된 공간을 찾을 수 없기 때문에 다음 GC가 미리 시작되지 않습니다.
2. G1의 또 다른 주요 장점인 예측 가능한 일시정지. G1과 CMS의 공통 초점은 일시정지 시간을 줄이는 것 외에도 예측 가능한 일시정지 시간 모델을 구축하는 것입니다. 이는 사용자가 N 밀리초 길이의 시간 세그먼트 내에서 가비지 수집에 소요되는 시간이 N 밀리초를 초과하지 않도록 명시적으로 지정할 수 있도록 하는 실시간 Java(RTSJ) 가비지 수집기의 기능입니다.
위에서 언급한 가비지 컬렉터는 신세대나 구세대 전체만 수집하는데, G1은 더 이상 이렇지 않습니다. G1 컬렉터를 사용하는 경우 Java 힙의 메모리 레이아웃은 다른 컬렉터와 매우 다릅니다. 전체 Java 힙을 동일한 크기의 여러 독립 영역(Region)으로 나눕니다. 유지되지만 신세대와 구세대는 더 이상 물리적으로 분리되지 않습니다. 둘 다 부분(불연속적일 수 있음) 영역의 집합입니다.
G1의 신세대 컬렉션은 ParNew와 비슷합니다. 신세대 점유율이 일정 비율에 도달하면 컬렉션이 시작됩니다. CMS와 마찬가지로 G1 수집기가 이전 세대 개체를 수집할 때 잠시 일시 중지됩니다.
수집 단계:
1. 표시 단계, 첫 번째 초기 표시(Initial-Mark), 이 단계는 일시 중지되고(Stop the World 이벤트) 트리거됩니다. 일반 Mintor GC. GC 로그에 해당: GC 일시정지(young)(초기 표시)
2. 루트 영역 검색. 프로그램 실행 중에 생존 영역이 재활용됩니다(이 프로세스는 이전 세대로 유지됩니다). Young GC 이전에 완료되어야 합니다.
3. 동시 마킹, 전체 힙에서 동시 마킹을 수행합니다(애플리케이션과 동시에 실행). 이 프로세스는 Young GC에 의해 중단될 수 있습니다. 동시 마킹 단계에서 해당 영역 객체의 모든 객체가 쓰레기로 판명되면 해당 영역은 즉시 재활용됩니다(그림의 X). 동시에 동시 마킹 과정에서 각 지역의 객체 활동(해당 지역에서 살아남은 객체의 비율)이 계산됩니다.
4. 주의사항, 잠시 멈춤(STW)이 발생합니다. 재마킹 단계는 동시 마킹 단계에서 생성된 새로운 가비지를 수집하는 데 사용됩니다(동시 단계는 애플리케이션과 함께 실행됨). G1은 CMS: 시작 시 스냅샷(SATB)보다 빠른 초기 스냅샷 알고리즘을 사용합니다. .
5. 복사/정리, 멀티 스레드 지우기 비활성 개체, STW가 있습니다. G1은 재활용 영역에 남아 있는 객체를 새 영역에 복사하고 기억 세트를 지우는 동시에 재활용 영역을 지우고 자유 영역 연결 목록으로 되돌립니다.
6. 복사/삭제 작업 후. 재활용 구역의 활성 물체는 진한 파란색과 진한 녹색 영역에 집중되어 있습니다.
자주 사용되는 컬렉터 조합