Python 프로그램의 실행 프로세스에는 소스 코드를 바이트코드로 변환(즉, 컴파일)하고 바이트코드를 실행하는 것이 포함됩니다.
WBOY
풀어 주다: 2023-05-09 16:37:09
앞으로
1774명이 탐색했습니다.
질문:
우리는 텍스트를 처리하거나 시스템 관리 작업을 수행하기 위해 매일 Python 프로그램을 작성해야 합니다. 프로그램이 작성된 후 python 명령만 입력하면 프로그램을 시작하고 실행을 시작할 수 있습니다.
$ python some-program.py
로그인 후 복사
그러면 텍스트 형식의 .py 파일이 CPU에서 단계별로 실행할 수 있는 기계 명령어로 어떻게 변환됩니까? 단계? ? 또한 프로그램 실행 중에 .pyc 파일이 생성될 수 있습니다. 이 파일의 기능은 무엇입니까?
1. 실행 과정
파이썬은 동작 면에서는 쉘 스크립트와 같은 해석형 언어에 더 가깝지만, 사실 파이썬 프로그램의 실행 원리는 가상 머신으로 요약할 수 있는 자바나 C#과 동일합니다. 및 단어 섹션 코드 . Python은 두 단계로 프로그램을 실행합니다. 먼저 프로그램 코드를 바이트코드로 컴파일한 다음 가상 머신을 시작하여 바이트코드를 실행합니다.
Python 명령을 Python 인터프리터라고도 부르지만 기본적으로 다른 명령과 동일합니다. 스크립팅 언어 해석기는 차이점을 나타냅니다. 실제로 Python 인터프리터는 컴파일러와 가상 머신의 두 부분으로 구성됩니다. Python 인터프리터가 시작되면 주로 다음 두 단계를 수행합니다.
컴파일러는 .py 파일의 Python 소스 코드를 바이트코드로 컴파일합니다. 따라서 가상 머신은 컴파일러에서 생성된 바이트코드를 한 줄씩 실행합니다. .py 파일의 Python 문은 기계 명령어로 직접 변환되지 않고 Python 바이트코드로 변환됩니다.
2. 바이트코드
파이썬 프로그램의 컴파일된 결과는 바이트코드이며, 여기에는 파이썬 작동과 관련된 많은 내용이 포함되어 있습니다. 따라서 Python 가상 머신의 작동 메커니즘을 더 깊이 이해하기 위해서든 Python 프로그램의 작동 효율성을 최적화하기 위해서든 바이트코드가 핵심 콘텐츠입니다. 그렇다면 Python 바이트코드는 어떤 모습일까요? Python 프로그램의 바이트코드를 어떻게 얻을 수 있나요? Python은 소스 코드를 즉시 컴파일할 수 있는 내장 함수 컴파일을 제공합니다. 소스 코드의 컴파일 결과를 얻으려면 컴파일할 소스 코드를 매개 변수로 사용하여 컴파일 함수를 호출하기만 하면 됩니다.
3. 소스 코드 컴파일
아래에서는 컴파일 기능을 통해 프로그램을 컴파일합니다.
소스 코드는 데모.py 파일에 저장됩니다.
PI = 3.14
def circle_area(r):
return PI * r ** 2
class Person(object):
def __init__(self, name):
self.name = name
def say(self):
print('i am', self.name)
로그인 후 복사
컴파일하기 전에 소스 코드를 파일에서 읽어야 합니다.
>>> text = open('D:\myspace\code\pythonCode\mix\demo.py').read()
>>> print(text)
PI = 3.14
def circle_area(r):
return PI * r ** 2
class Person(object):
def __init__(self, name):
self.name = name
def say(self):
print('i am', self.name)
로그인 후 복사
그런 다음 컴파일 함수는 소스 코드를 컴파일합니다:
>>> result = compile(text,'D:\myspace\code\pythonCode\mix\demo.py', 'exec')
로그인 후 복사
컴파일 함수에는 3개의 매개변수가 필요합니다:
source: 컴파일할 소스 코드
filename: 소스 코드가 있는 파일 이름
mode: 컴파일 모드, exec는 소스 코드를 모듈로 처리하는 것을 의미합니다. 컴파일
세 가지 컴파일 모드:
exec: 모듈 소스 코드를 컴파일하는 데 사용
single: 단일 Python 문(대화식)을 컴파일하는 데 사용
eval: 컴파일에 사용 평가 표현식
4. PyCodeObject
컴파일 함수를 통해 최종 소스 코드 컴파일 결과를 얻었습니다.
>>> result
<code object <module> at 0x000001DEC2FCF680, file "D:\myspace\code\pythonCode\mix\demo.py", line 1>
>>> result.__class__
<class 'code'>
로그인 후 복사
마지막으로 코드 유형 객체를 얻었고 해당 기본 구조는 PyCodeObject
PyCodeObject 소스 코드는 다음과 같습니다.
/* Bytecode object */
struct PyCodeObject {
PyObject_HEAD
int co_argcount; /* #arguments, except *args */
int co_posonlyargcount; /* #positional only arguments */
int co_kwonlyargcount; /* #keyword only arguments */
int co_nlocals; /* #local variables */
int co_stacksize; /* #entries needed for evaluation stack */
int co_flags; /* CO_..., see below */
int co_firstlineno; /* first source line number */
PyObject *co_code; /* instruction opcodes */
PyObject *co_consts; /* list (constants used) */
PyObject *co_names; /* list of strings (names used) */
PyObject *co_varnames; /* tuple of strings (local variable names) */
PyObject *co_freevars; /* tuple of strings (free variable names) */
PyObject *co_cellvars; /* tuple of strings (cell variable names) */
/* The rest aren't used in either hash or comparisons, except for co_name,
used in both. This is done to preserve the name and line number
for tracebacks and debuggers; otherwise, constant de-duplication
would collapse identical functions/lambdas defined on different lines.
*/
Py_ssize_t *co_cell2arg; /* Maps cell vars which are arguments. */
PyObject *co_filename; /* unicode (where it was loaded from) */
PyObject *co_name; /* unicode (name, for reference) */
PyObject *co_linetable; /* string (encoding addr<->lineno mapping) See
Objects/lnotab_notes.txt for details. */
void *co_zombieframe; /* for optimization only (see frameobject.c) */
PyObject *co_weakreflist; /* to support weakrefs to code objects */
/* Scratch space for extra data relating to the code object.
Type is a void* to keep the format private in codeobject.c to force
people to go through the proper APIs. */
void *co_extra;
/* Per opcodes just-in-time cache
*
* To reduce cache size, we use indirect mapping from opcode index to
* cache object:
* cache = co_opcache[co_opcache_map[next_instr - first_instr] - 1]
*/
// co_opcache_map is indexed by (next_instr - first_instr).
// * 0 means there is no cache for this opcode.
// * n > 0 means there is cache in co_opcache[n-1].
unsigned char *co_opcache_map;
_PyOpcache *co_opcache;
int co_opcache_flag; // used to determine when create a cache.
unsigned char co_opcache_size; // length of co_opcache.
};
로그인 후 복사
코드 객체 PyCodeObject는 코드에 포함된 바이트코드와 상수, 이름 등을 포함한 컴파일 결과를 저장하는 데 사용됩니다. 주요 필드는 다음과 같습니다.
>>> result.co_consts
(3.14, <code object circle_area at 0x0000023D04D3F310, file "D:\myspace\code\pythonCode\mix\demo.py", line 3>, 'circle_area', <code object Person at 0x0000023D04D3F5D0, file "D:\myspace\code\pythonCode\mix\demo.py", line 6>, 'Person', None)
>>> person_code = result.co_consts[3]
>>> person_code
<code object Person at 0x0000023D04D3F5D0, file "D:\myspace\code\pythonCode\mix\demo.py", line 6>
>>> person_code.co_consts
('Person', <code object __init__ at 0x0000023D04D3F470, file "D:\myspace\code\pythonCode\mix\demo.py", line 7>, 'Person.__init__', <code object say at 0x0000023D04D3F520, file "D:\myspace\code\pythonCode\mix\demo.py", line 10>, 'Person.say', None)