목록 생성을 통해 간단하고 직접적으로 목록을 생성할 수 있지만, 메모리 제약으로 인해 목록 용량이 확실히 제한됩니다. 더욱이, 100만 개의 요소를 포함하는 목록을 만드는 것은 많은 저장 공간을 차지할 뿐만 아니라 처음 몇 개의 요소에만 액세스해야 한다면 대부분의 후속 요소가 차지하는 공간이 낭비됩니다.
그렇다면 특정 알고리즘에 따라 목록 요소를 계산할 수 있다면 루프 동안 계속해서 후속 요소를 계산할 수 있습니까? 이렇게 하면 전체 목록을 만들 필요가 없어 많은 공간이 절약됩니다. Python에서는 이러한 반복과 계산을 동시에 수행하는 메커니즘을 생성기라고 합니다.
생성기를 만드는 방법에는 여러 가지가 있습니다. 첫 번째 방법은 매우 간단합니다. 목록 생성 표현식에서 []를 ()로 변경하여 생성기를 만듭니다.
>>> mylist = [ x for x in range(1, 10)] >>> mylist [1, 2, 3, 4, 5, 6, 7, 8, 9] >>> gen = (x for x in range(1,10)) >>> gen <generator object <genexpr> at 0x7f1d7fd0f5a0>
Create mylist 유일한 차이점은 다음과 같습니다. from gen은 가장 바깥쪽의 []이고 ()는 Mylist가 목록이고 gen이 생성기입니다.
리스트의 각 요소를 직접 출력할 수 있는데 생성기의 각 요소를 어떻게 출력하나요?
하나씩 인쇄하려면 생성기의 next() 메소드를 사용할 수 있습니다.
>>> gen.next() 1 >>> gen.next() 2 >>> gen.next() 3 ... >>> gen.next() 9 >>> gen.next() Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration
앞서 말했듯이 생성기는 알고리즘을 저장합니다. next()가 호출될 때마다 마지막 요소가 계산될 때까지 다음 요소의 값이 계산됩니다. 더 이상 요소가 없으면 StopIteration 오류가 발생합니다.
실제로 next() 메서드 대신 for 루프를 사용할 수 있는데 이는 효율적인 프로그래밍 아이디어에 더 부합합니다.
>>> gen = ( x for x in range(1, 10)) >>> for num in gen: ... print num ... 1 2 3 4 5 6 7 8 9
발전기는 매우 강력합니다. 계산 알고리즘이 상대적으로 복잡하고 리스트 생성과 유사한 for 루프를 사용하여 구현할 수 없는 경우 함수를 사용하여 구현할 수도 있습니다.
예를 들어 유명한 피보나치 수열에서는 첫 번째와 두 번째 숫자를 제외하고 처음 두 숫자에 어떤 숫자도 추가할 수 있습니다.
1, 1, 2, 3, 5, 8, 13, 21, 34, ...
피보나치 수열은 목록 생성을 사용하여 작성할 수 없지만 다음 함수를 사용하여 쉽게 인쇄할 수 있습니다.
def fib(max): n = 0 a, b = 0, 1 while n < max: print b a, b = b, a + b n = n + 1
위 함수는 피보나치 수열의 처음 N개 숫자를 출력할 수 있습니다.
>>> fib(6) 1 1 2 3 5 8
자세히 살펴보면 fib 함수가 실제로 피보나치 수열의 계산 규칙을 정의한다는 것을 알 수 있습니다. 첫 번째 요소부터 시작하여 모든 후속 요소를 계산할 수 있습니다. 이 논리는 실제로 매우 유사합니다.
즉, 위 함수는 제너레이터에서 한발짝 떨어져 있을 뿐입니다. fib 함수를 생성기로 바꾸려면 print b를 Yield b로 변경하면 됩니다.
def fib(max): n = 0 a, b = 0, 1 while n < max: yield b a, b = b, a + b n = n + 1
이는 생성기 메서드를 정의하는 또 다른 방법입니다. 함수 정의에 Yield 키워드가 포함되어 있으면 함수는 더 이상 일반 함수가 아니라 생성기입니다.
>>> fib(6) <generator object fib at 0x104feaaa0>
여기서 마지막 What is 이해하기 어려운 것은 생성기와 함수의 실행 흐름이 다르다는 것입니다. 함수는 순차적으로 실행되며 return 문이나 function 문의 마지막 줄을 만나면 반환됩니다. 제너레이터가 되는 함수는 next()가 호출될 때마다 실행되고, Yield 문을 만나면 반환되며, 다시 실행되면 지난 번 반환된 Yield 문부터 계속해서 실행됩니다.
간단한 예로 숫자 1, 3, 5를 순서대로 반환하는 생성기를 정의합니다.
>>> def odd(): ... print 'step 1' ... yield 1 ... print 'step 2' ... yield 3 ... print 'step 3' ... yield 5 ... >>> o = odd() >>> o.next() step 1 1 >>> o.next() step 2 3 >>> o.next() step 3 5 >>> o.next() Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration
보시다시피,odd는 일반적인 함수가 아니라 생성기입니다. 실행 중에 Yield를 만나면 중단되고 다음 번에 실행이 계속됩니다. Yield를 3번 실행한 후에는 더 이상 실행할 Yield가 없으므로 next()를 4번 호출하면 오류가 보고됩니다.
fib의 예로 돌아가서 루프 중에 계속해서 Yield를 호출하면 계속해서 중단됩니다. 물론 루프를 종료하려면 루프에 대한 조건을 설정해야 합니다. 그렇지 않으면 무한한 숫자가 나열됩니다.
마찬가지로 함수를 생성기로 변경한 후 기본적으로 next()를 사용하여 호출하지 않고 for 루프를 직접 사용하여 반복합니다.
>>> for n in fib(6): ... print n ... 1 1 2 3 5 8
Generator는 Python에서 간단히 목록 생성을 생성기로 변경할 수도 있고, 함수를 통해 복잡한 논리 생성기를 구현할 수도 있는 매우 강력한 도구입니다.
생성기의 작동 원리를 이해하기 위해 for 루프 동안 다음 요소를 지속적으로 계산하고 적절한 조건에서 for 루프를 종료합니다. 함수에서 변경된 제너레이터의 경우 return 문을 만나거나 함수 본문의 마지막 줄이 실행되면 제너레이터를 종료하라는 명령이고 그에 따라 for 루프도 종료됩니다.