들어가기전에...
자바는 OS에 독립적인 특징을 가지고 있다.
OS에 독립적인 특징이라는것은 우리가 해당 코드를 실행하는 환경이 Window이든 MacOS이던지 차이가 없이 구동이 가능하다는 얘기이다.
그게 가능한 이유는 JVM덕분이다. 그렇다면 JVM의 어떠한 기능 때문에, OS에 독립적으로 실행시킬 수 있는지 자바 컴파일 과정을 통해 알아보도록 해보자
자바의 컴파일 과정
- 개발자가 Java를 사용해서 소스 코드를 작성한다(.java)
- 자바 컴파일러가 자바 소스파일을 컴파일한다. 이떄 나오는 파일은 자바 바이트 코드(.class)파일로 아직 컴퓨터가 읽을 수 없는 자바 가상 머신이 이해할 수 있는 코드이다. 바이트 코드의 각 명령어는 1바이트 크기의 Opcode와 추가 피연산자로 이루어져 있다.
- 컴파일된 바이트 코드를 JVM의 클래스 로더에게 전달한다.
- 클래스 로더는 동적 로딩을 통해 필요한 클래스들을 로딩 및 링크하여 런타임 데이터영역(Runtime Data Area) 즉, JVM의 메모리에 올린다.
- 실행엔진은 JVM메모리에 올라온 바이트 코드들을 명령어 단위로 하나씩 가져와서 실행하게 된다.
JVM의 구조( 클래스로더, Runtime Data Area, JIT 컴파일러)
자바 가상 머신을 뜻하는 JVM은 자바 프로그램 실행 환경을 만들어주는 소프트웨어이다. 자바 코드를 컴파일하여 .class 바이트 코드로 만들면 이 코드가 자바 가상 머신 환경에서 실행하게 된다. JVM은 자바 실행 환경 JRE에 포함되어 있다.
클래스 로더
자바는 동적으로 클래스를 읽어온다. 프로그램이 실행 중인 런타임 상태가 되어서야 모든 코드가 자바 가상 머신과 연결이 된다. 이렇게 동적으로 클래스를 로딩해주는 역할을 하는 것이 바로 클래스 로더(Class Loader)라는 것이다.
즉, Java에서 소스(Code)를 작성하면 .java 라는 파일이 생성되고 그것을 컴파일러가 컴파일을 진행하면 .class 파일이 된다. 여기서 클래스 로더는 .class 파일을 묶어서 JVM이 운영체제로 부터 할당받은 메모리 영역인 Runtime Data Area로 적재하게 된다
클래스 로더의 세부 동작
- 로드 : 클래스 파일을 가져와서 JVM의 메모리에 로드한다.
- 검증 : 자바 언어 명세및 JVM 명세에 명시된 대로 구성되어 있는지 검사하게 된다
- 준비 : 클래스가 필요로 하는 메모리를 할당한다(필드, 메소드, 인터페이스 등등)
- 분석 : 클래스의 상수 풀 내 모든 심볼릭 레퍼런스를 다이렉트 레퍼런스로 변경한다
- 초기화 : 클래스 변수들을 적절한 값으로 초기화한다 (static 필드)
런타임 데이터 영역(Runtime Data Area)
이곳은 JVM의 메모리를 담당하는 영역으로써 자바 어플을 실행할 때 사용되는 데이터들을 적재하는 영역이다.
- 모든 스레드가 공유해서 사용한다 → 가비지 컬렉터의 대상이 된다
- 힙 영역
- 메소드 영역
- 스레드 마다 하나씩 생성되는 영역
- 스택 영역
- PC 레지스터
- 네이티브 메소드 스택
메소드 영역(Method Area)
클래스 멤버 변수의 이름, 데이터 타입, 접근 제어자 정보와 같은 각종 필드 정보들과 메소드 정보, 데이터 Type 정보, Constant pool, static 변수, final class 등이 생성되는 영역입니다
힙 영역(Heap Area)
- new 키워드를 기반으로 생성된 객체와 배열이 생성되는 영역이다.
- 주기적으로 GC가 제거하는 영역이다.
힙 영역은 효율적인 GC를 위해서 위의 사진과 같이 영역을 나눈다.
Young Generation 영역은 자바 객체가 생성되자마자 저장이 되고, 생긴지 얼마 안되는 객체가 저장되는 공간이다.
- Heap영역에 객체가 생성되면 최초로 Eden 영역에 할당이 된다.
- 데이터가 어느정도 쌓이게 되면 참조 정도에 따라 Servivor의 빈 공간으로 이동 or 회수 된다
- Young Generation의 영역이 또 차게 되면 참도 정도에 따라 Old 영역으로 이동 or 회수된다
- Old 영역에 할당된 메모리가 허용치를 넘게 되면 해당 영역의 모든 객체들을 검사하여 참조되지 않는 객체들을 한꺼번에 삭제하는 GC가 실행하게 된다
- 시간이 오래걸린다. 이떄 GC를 실행하는 쓰레드를 제외한 모든 스레드는 작업을 멈추게 된다
이를 Stop - the - World라고 하고 Old 영역의 메모리를 회수하게 되는 GC를 Major GC라고 한다
스택 영역(Stack Area)
지역 변수, 파라미터, 리턴 값, 연산에 사용되는 임시 값들이 생성되는 영역이다.
PC 레지스터
Thread가 생성 될 때마다 생성되는 영역이다. 프로그램 카운터
즉, 현재 스레드가 실행되는 부분의 주소와 명령을 저장하고 있는 영역이다.
네이티브 메소드 스택
- 자바 이외의 언어로 작성된 네이티브 코드를 실행할 때 사용하는 메모리 영역으로 일반적인 C 스택을 사용한다.
- 보통 C/C++ 등의 코드를 수행하기 위한 스택을 말하며 자바 컴파일러에 의해 변환된 자바 바이트 코드를 읽고 해성하는 역할을 하는 것이 자바 인터프리터이다.
실행 엔진
앞서 말한것처럼 클래스 로더에 의해 JVM으로 로드된 .class 파일은 Runtime Data Area의 Method Area로 적재되는데 이후 JVM은 Method Area의 바이트 코드를 실행 엔진에 제공하여, 정의된 내용대로 바이트 코드를 실행시킨다.
이때 로드된 바이트코드를 실행하는 런타임 모듈이 실행 엔진이다. 실행 엔진은 바이트 코드를 명령어 단위로 읽어서 실행하게 된다. 이때 인터프리터와 JIT 컴파일러, 두가지 방식으로 변경한다.
https://latewalk.tistory.com/179
JIT 컴파일러 와 인터프리터
JIT 컴파일 또는 동적 번역은 프로그램을 실제 실행하는 시점에 기계어로 번력하는 컴파일 기법이다. 컴파일러 와 인터프리터 컴파일과 인터프리터 모두 high-level language를 machine language로 번역한
latewalk.tistory.com
가비지 컬렉터
JVM은 가비지 컬렉터를 이용해서 더는 사용하지 않는 메모리를 자동으로 회수한다. 따라서 개발자가 따로 메모리를 관리하지 않아도 되는데, 더욱 손쉽게 프로그래밍을 할 수 있도록 도와준다. Heap 메모리 영역에 생성된 객체들 중에 참조되지 않은 객체들을 탐색한 후에 제거하는 역할을 하며 해당 역할을 하는 시간이 정확히 언제인지는 알 수 없다. GC 역할을 수행하는 스레드를 제외한 나머지 모든 스레드들은 일시정지(Stop - the - World)상태가 된다.
'CS > 📝 언어' 카테고리의 다른 글
🖨 new String() 과 ""의 차이 (0) | 2024.06.04 |
---|---|
🖨 절차 지향과 객체 지향 프로그래밍의 차이 (0) | 2024.05.22 |
🖨 OOP란?? (0) | 2024.05.22 |
추상 클래스와 인터페이스의 차이 (0) | 2023.10.26 |
JIT 컴파일러 와 인터프리터 (0) | 2023.10.18 |