產生器
1、為什麼需要生成器
透過上面的學習,可以知道清單生成式,我們可以直接建立一個清單。但是,受到記憶體限制,列表容量肯定是有限的。而且,創建一個包含 1000 萬個元素的列表,不僅佔用很大的存儲空間,如果我們僅僅需要訪問前面幾個元素,那後面絕大多數元素佔用的空間都白白浪費了。
所以,如果列表元素可以依照某種演算法推導出來,那我們是否可以在循環的過程中不斷推導出後續的元素呢?這樣就不必創建完整的 list,從而節省大量的空間。在 Python 中,這種一邊循環一邊計算的機制,稱為生成器:generator。
在 Python 中,使用了 yield 的函數稱為生成器(generator)。
跟普通函數不同的是,生成器是一個傳回迭代器的函數,只能用於迭代操作,更簡單點理解生成器就是一個迭代器。
在呼叫生成器運行的過程中,每次遇到 yield 時函數會暫停並保存目前所有的運行信息,返回yield的值。並在下一次執行 next()方法時從目前位置繼續運行。
那麼要如何建立一個生成器呢?
2、生成器的建立
最簡單、最簡單的方法就是把一個清單產生式的[] 改成()
# -*- coding: UTF-8 -*- gen= (x * x for x in range(10)) print(gen)
輸出的結果:
<generator object <genexpr> at 0x0000000002734A40>
建立List 和generator 的差異僅在於最外層的[] 和() 。但是生成器並不真正創建數字列表, 而是返回一個生成器,這個生成器在每次計算出一個條目後,把這個條目「產生」 ( yield ) 出來。生成器表達式使用了“惰性計算” ( lazy evaluation,也有翻譯為“延遲求值”,我以為這種按需調用call by need 的方式翻譯為惰性更好一些),只有在檢索時才被賦值( evaluated ),所以在列表比較長的情況下使用記憶體上更有效。
那麼竟然知道如何建立一個生成器,那要怎麼查看裡面的元素呢?
3、遍歷生成器的元素
按我們的思維,遍歷用for 循環,對了,我們可以試試:
# -*- coding: UTF-8 -*- gen= (x * x for x in range(10)) for num in gen : print(num)
沒錯,直接這樣就可以遍歷出來了。當然,上面也提到了迭代器,那麼用 next() 可以遍歷嗎?當然也是可以的。
4、以函數的形式實作生成器
上面也提到,創建生成器最簡單、最簡單的方法就是把一個列表生成式的[]改成()。為啥突然來個以函數的形式來創建呢?
其實產生器也是迭代器,但你只能對其迭代一次。這是因為它們並沒有把所有的值存在記憶體中,而是在運行時產生值。你透過遍歷來使用它們,要麼用一個「for」循環,要麼將它們傳遞給任意可以進行迭代的函數和結構。而且實際運用中,大多數的生成器都是透過函數來實現的。那我們該如何透過函數來創建呢?
先不急,來看下這個例子:
# -*- coding: UTF-8 -*- def my_function(): for i in range(10): print ( i ) my_function()
輸出的結果:
0 1 2 3 4 5 6 7 8 9
如果我們需要把它變成生成器,我們只需要把print ( i ) 改為yield i 就可以了,具體看下修改後的例子:
# -*- coding: UTF-8 -*- def my_function(): for i in range(10): yield i print(my_function())
輸出的結果:
<generator object my_function at 0x0000000002534A40>
但是,這個例子非常不適合使用生成器,發揮不出生成器的特點,生成器的最好的應用應該是:你不想在同一時間將所有計算出來的大量結果集分配到記憶體當中,特別是結果集裡還包含循環。因為這樣會耗很大的資源。
例如下面是一個計算斐波那契數列的生成器:
# -*- coding: UTF-8 -*- def fibon(n): a = b = 1 for i in range(n): yield a a, b = b, a + b # 引用函数 for x in fibon(1000000): print(x , end = ' ')
運行的效果:
你看,運行一個這麼打的參數,也不會說有卡死的狀態,因為這種方式不會使用太大的資源。這裡,最難理解的就是 generator 和函數的執行流程不一樣。函數是順序執行,遇到 return 語句或最後一行函數語句就回傳。而變成 generator 的函數,在每次呼叫 next() 的時候執行,遇到 yield語句返回,再次執行時從上次返回的 yield 語句處繼續執行。
例如這個例子:
# -*- coding: UTF-8 -*- def odd(): print ( 'step 1' ) yield ( 1 ) print ( 'step 2' ) yield ( 3 ) print ( 'step 3' ) yield ( 5 ) o = odd() print( next( o ) ) print( next( o ) ) print( next( o ) ) 输出的结果: step 1 1 step 2 3 step 3 5
可以看到,odd 不是普通函數,而是 generator,在執行過程中,遇到 yield 就中斷,下次又繼續執行。執行 3 次 yield 後,已經沒有 yield 可以執行了,如果你繼續打印 print( next( o ) ) ,就會報錯的。所以通常在 generator 函數中都要對錯誤進行捕獲。
5、列印楊輝三角
透過學習了生成器,我們可以直接利用生成器的知識點來列印楊輝三角:
# -*- coding: UTF-8 -*- def triangles( n ): # 杨辉三角形 L = [1] while True: yield L L.append(0) L = [ L [ i -1 ] + L [ i ] for i in range (len(L))] n= 0 for t in triangles( 10 ): # 直接修改函数名即可运行 print(t) n = n + 1 if n == 10: break
輸出的結果為:
[1] [1, 1] [1, 2, 1] [1, 3, 3, 1] [1, 4, 6, 4, 1] [1, 5, 10, 10, 5, 1] [1, 6, 15, 20, 15, 6, 1] [1, 7, 21, 35, 35, 21, 7, 1] [1, 8, 28, 56, 70, 56, 28, 8, 1] [1, 9, 36, 84, 126, 126, 84, 36, 9, 1]