전체 코드 파일은 다음과 같습니다. Code
1. 소스코드
Python 스크립트를 작성하면 사람이 읽을 수 있는 텍스트입니다. 이 소스코드는 모든 것의 출발점입니다.
.py 파일로 작성된 Python 소스 코드는 사람이 읽을 수 있습니다. 이 코드는 변수, 함수, 루프 등을 지정하여 프로그램이 수행하는 작업을 정의합니다.
2. 바이트코드로 컴파일(컴파일러)
Python 프로그램을 실행할 때 첫 번째 단계는 소스 코드를 바이트코드로 컴파일하는 것입니다. 이는 Python 인터프리터에 의해 수행됩니다:
-
구문 검사: 구문 오류가 없는지 확인합니다.
-
컴파일: 상위 수준 소스 코드를 하위 수준의 플랫폼 독립적 표현인 바이트코드로 변환합니다. 이 바이트코드는 일반적으로 __pycache__ 디렉터리 내의 .pyc 파일에 있습니다.
-
컴파일러: Python은 인터프리터를 사용하지만 먼저 소스 코드를 바이트코드라는 하위 수준 형식으로 컴파일합니다.
-
토큰화: 코드를 토큰(예: 키워드, 연산자, 식별자)이라는 작은 조각으로 나눕니다.
-
파싱: 토큰을 분석하여 Python의 구문 규칙을 따르는지 확인합니다.
-
제어 흐름 그래프(CFG): 프로그램 실행 중에 프로그램을 통해 통과할 수 있는 모든 경로를 나타냅니다.
-
바이트코드 생성: 구문 분석된 토큰을 Python 가상 머신(PVM)에 대한 명령 집합인 바이트코드로 변환합니다.
자세히 알아보겠습니다.
Python 컴파일러: Python은 해석 언어로 알려져 있지만 컴파일 단계가 있습니다. 분석 내용은 다음과 같습니다.
토큰화:
- 코드를 토큰(예: 키워드, 연산자, 식별자)이라는 작은 조각으로 나눕니다.
-
소스 코드: 작성한 코드로 시작합니다.
-
Tokenizer(Lexer): 소스 코드를 키워드(for, if), 연산자( , -), 식별자(변수 이름) 및 리터럴(숫자 또는 문자열 등)과 같은 토큰이라는 작은 조각으로 나눕니다. .
-
파싱: 토큰을 분석하여 Python의 구문 규칙을 따르는지 확인합니다.
-
구문 분석: 파서는 이러한 토큰을 가져와 Python의 문법 규칙과 비교하여 확인합니다.
-
Parse Tree: 토큰에서 트리 구조를 구축하여 코드의 문법 구조를 나타냅니다.
-
의미론적 분석: 코드가 데이터 유형, 범위 및 기타 상황별 규칙 측면에서 의미가 있는지 확인합니다.
-
제어 흐름 그래프(CFG): 프로그램 실행 중에 프로그램을 통해 통과할 수 있는 모든 경로를 나타냅니다.
-
제어 흐름 그래프: 실행 중에 코드를 통해 수행될 수 있는 모든 가능한 경로를 나타냅니다.
-
노드와 에지: 각 노드는 코드의 기본 블록을 나타내고, 에지는 한 블록에서 다른 블록으로의 제어 흐름을 나타냅니다.
-
바이트코드 생성: 구문 분석된 토큰을 Python 가상 머신(PVM)에 대한 명령 세트인 바이트코드로 변환합니다.
- 바이트코드는 실행에 최적화된 소스 코드를 보다 간결하고 낮은 수준으로 표현한 것입니다. 플랫폼 독립적이므로 호환되는 PVM이 있는 모든 시스템에서 실행할 수 있습니다.
-
바이트코드: 구문 분석된 코드는 하위 수준의 플랫폼 독립적 표현인 바이트코드로 변환됩니다.
-
명령어 세트: 이 바이트코드는 Python 가상 머신(PVM)이 실행할 수 있는 명령어 세트입니다. 바이트코드는 향후 실행 속도를 높이기 위해 __pycache__ 디렉터리의 .pyc 파일에 저장됩니다.
3. 바이트코드(Byte code) 로딩
컴파일 후 Python 가상 머신은 바이트코드를 로드합니다.
-
캐시에서 읽기: 바이트코드가 이전에 컴파일되었고 변경되지 않은 경우 캐시(__pycache__)에서 읽습니다. 이렇게 하면 컴파일 단계를 건너뛰어 실행 속도가 빨라집니다.
- 바이트코드가 메모리에 로드되어 실행될 준비가 되었습니다. 그런 다음 바이트코드는 PVM에 의해 실행되어 프로그램 작업을 수행하기 위한 지침을 해석합니다.
4. PVM(PVM)에 의한 실행
이제 PVM은 바이트코드를 해석하고 실행합니다.
-
명령어 실행: PVM은 각 바이트코드 명령어를 읽고 실행합니다. 각 명령은 값 로드, 산술 수행 또는 함수 호출과 같은 특정 작업에 해당합니다.
-
메모리 관리: 변수와 객체에 대한 메모리 할당 및 할당 해제를 관리합니다.
Python의 메모리 관리:
-
참조 카운팅: Python은 메모리에 있는 객체에 대한 참조 수를 추적합니다. 참조 횟수가 0으로 떨어지면 객체가 차지한 메모리를 회수할 수 있습니다.
-
객체 할당: 코드가 실행될 때 Python 객체(예: 정수, 문자열, 목록)가 메모리에 생성됩니다.
-
가비지 수집: Python에는 더 이상 사용하지 않는 메모리(예: 참조 횟수가 0인 객체)를 할당 해제하여 메모리 관리를 돕는 가비지 수집기가 있습니다.
-
메모리 풀링: Python은 메모리 풀을 사용하여 작은 객체를 보다 효율적으로 할당합니다. 이 풀링은 작은 메모리 덩어리를 자주 할당하고 할당 취소하는 오버헤드를 줄이는 데 도움이 됩니다.
-
메모리 최적화: Python은 메모리 사용량을 최소화하기 위해 다음과 같은 다양한 최적화를 적용합니다.
- PVM은 효율성을 높이기 위해 일부 구현(예: PyPy)에서 JIT(Just-In-Time) 컴파일과 같은 다양한 런타임 최적화를 수행합니다.
- 작은 정수와 인턴된 문자열을 재사용합니다.
- 데이터 구조(예: 튜플, 목록, 사전)를 효율적으로 관리합니다.
예:
-
바이트코드 캐싱: PVM은 소스 코드가 매번 다시 컴파일되는 것을 방지하기 위해 컴파일된 바이트코드를 캐시합니다. 이렇게 하면 후속 실행 속도가 빨라집니다.
-
상수 접기: 런타임이 아닌 컴파일 타임에 상수 표현식을 단순화하는 작업이 포함됩니다. 예를 들어 3 * 2는 6으로 미리 계산될 수 있습니다.
요약하자면, PVM은 오케스트라 지휘자와 같아서 바이트코드를 컴퓨터가 실행할 수 있는 작업으로 원활하게 전환합니다. 아름다운 점은 PVM 덕분에 Python 코드가 이식 가능하고 수정 없이 다양한 플랫폼에서 실행될 수 있다는 것입니다.
바이트코드가 생성되었는지 여부를 어떻게 확인할 수 있나요?
Python 모듈을 가져오면 Python은 소스 코드를 바이트코드로 컴파일하여 __pycache__ 디렉터리에 저장합니다. 이렇게 하면 모듈을 가져올 때마다 다시 컴파일할 필요가 없으므로 향후 가져오기 속도가 빨라집니다.
과정은 다음과 같습니다.
-
첫 번째 가져오기: 모듈을 처음 가져올 때 Python은 .py 파일을 바이트코드로 컴파일합니다.
-
pycache 디렉토리: 바이트코드는 module_name.cpython-312.pyc와 같은 이름의 __pycache__ 디렉토리에 저장됩니다. # 312는 파이썬 버전입니다.
-
후속 가져오기: 후속 가져오기에서 Python은 __pycache__ 디렉터리에서 컴파일된 바이트 코드를 확인하고 소스 코드가 변경되지 않은 경우 이를 사용하여 가져오기 프로세스 속도를 높입니다.
예:
byte.py가 있습니다. byte.py를 실행한 후 hello_world.py에서 코드를 가져오면 해당 폴더에 __pycache__ 디렉터리가 있고 .pyc 파일을 볼 수 있습니다.
from hello_world import greet
greet("Byte code")
로그인 후 복사
로그인 후 복사
py_compile을 사용하여
py_compile 모듈: Python 소스 파일을 바이트코드 파일로 컴파일할 수 있습니다. 이는 향후 실행을 위해 스크립트 실행 속도를 높이는 편리한 방법입니다.
byte.py에서
import py_compile
py_compile.compile('hello_world.py')
로그인 후 복사
로그인 후 복사
- py_compile 모듈은 hello_world.py를 바이트코드로 컴파일합니다.
- 결과 바이트코드는 pycache 디렉터리에 저장되어 hello_world.cpython-38.pyc(또는 Python 버전에 따라 유사)라는 파일이 생성됩니다.
바이트코드 생성:
- 바이트코드를 생성하기 위해 전체 스크립트가 실행됩니다. 이는 모든 최상위 코드(예: print("Hello, World!") 및 print("c"))가 컴파일 프로세스 중에 실행된다는 의미입니다.
결과 바이트코드:
- 바이트코드에는 Python이 향후 스크립트 가져오기 속도를 높이기 위해 사용하는 모든 함수, 클래스 및 실행 가능 문이 포함되어 있습니다.
dis 모듈
Python의 dis 모듈은 바이트코드를 더 읽기 쉬운 형식으로 분해하는 데 사용됩니다. 이는 Python 코드가 내부적으로 수행하는 작업을 이해하는 데 도움이 될 수 있습니다. Python의 내부를 디버깅하거나 학습하는 데 특히 유용합니다.
from hello_world import greet
greet("Byte code")
로그인 후 복사
로그인 후 복사
산출
import py_compile
py_compile.compile('hello_world.py')
로그인 후 복사
로그인 후 복사
- 프로그램은 CPython 바이트코드를 분석하기 위한 강력한 도구인 dis 모듈을 가져오는 것으로 시작됩니다. CPython은 Python의 기본 구현이며 바이트코드는 Python 인터프리터의 중간 언어입니다.
- 다음으로 Greeting이라는 간단한 함수를 정의했습니다. 이 함수는 매개변수 이름을 입력받아 인사말을 인쇄합니다. 함수 자체는 매우 간단하지만 Python의 내부적으로 일어나는 일은 표면에서 보이는 것보다 더 복잡합니다.
- disassemble_function 함수는 disassemble 함수를 분해하기 위해 dis.dis()를 사용합니다. dis.dis()는 Python 함수를 Python의 가상 머신이 실제로 실행하는 하위 수준 바이트 코드로 변환합니다. 이 바이트코드는 우리의 Greeting 함수에 대한 Python의 해석이며 기계어 코드에 한 단계 더 가까워졌습니다.
- 스크립트가 disassemble_function()을 호출하면 콘솔 출력에 Greeting 함수의 바이트코드가 표시됩니다.
바이트코드가 알려주는 내용은 다음과 같습니다.
- LOAD_GLOBAL(0): 이 opcode는 전역 변수(이 경우 인쇄 기능)를 로드하는 데 사용됩니다.
- LOAD_CONST(1): 상수 값 'Hello,'를 스택에 로드합니다.
- LOAD_FAST(0): 이 opcode는 지역 변수 이름을 스택에 로드합니다.
- FORMAT_VALUE(0): 이름 문자열의 형식을 지정하여 생성할 문자열에 삽입할 수 있도록 준비합니다.
- BUILD_STRING(2): 스택의 상위 두 값('Hello' 및 name)을 가져와 최종 문자열을 작성합니다.
- CALL_FUNCTION(1): 이 줄은 괄호 안에 인수 개수를 사용하여 함수(스택에 로드한 전역 인쇄 함수)를 호출합니다(우리는 하나의 인수, 형식화된 문자열을 가집니다).
- POP_TOP: 스택의 맨 위를 제거합니다(print가 None을 반환하므로 이전 호출의 결과).
- LOAD_CONST(0): 로드 없음.
- RETURN_VALUE: Greeting 함수의 반환값으로, 명시적인 반환문이 없으므로 None입니다.
- 본질적으로 바이트코드는 Python이 인사 기능을 실행하기 위해 수행하는 개별 작업을 보여줍니다. 이러한 지침을 이해하는 것은 개발자가 Python이 코드를 실행하고, 기능을 최적화하고, 리소스를 관리하는 방법을 이해하는 데 중요합니다. 이 모든 작업은 Python 코드를 실행할 때 내부적으로 원활하게 발생합니다.
Python 기계실로의 즐거운 다이빙이 아닌가요? 계속 코딩하고 이 언어 엔진룸의 깊이를 계속 탐색해 보세요?!
위 내용은 Python의 내부 작업의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!