在前面的篇章中,我們學習了迭代器,這是一個很好的工具,特別是當你需要處理大型資料集時。然而,在Python中建立自己的迭代器有點麻煩和耗時。你必須定義一個實作迭代器協定(__iter__()和__next__()方法)的新類別。在這個類別中,需要自己管理變數的內部狀態並更新它們。此外,當__next__()方法中沒有要傳回的值時,需要拋出StopIteration異常。
有沒有更好的實作方式呢?答案是肯定的!這就是Python的生成器(Generator)解決方案。下面就來盤盤它。
為了更有效率的建立自己的迭代器,在Python中對此有一個優雅的解決方案,這是很值得高興的。 Python所提供的生成器(Generator)是用來幫助我們輕鬆建立迭代器。 Generator允許你宣告一個行為類似迭代器的函數,也就是說,它可以在for迴圈中使用。簡單言之,生成器(Generator)就是個傳回迭代器物件的函數。因此,這也是創建迭代器的簡單方法。在創建迭代器時,你不需要考慮所需的所有工作(如迭代協定和內部狀等),因為Generator將處理所有這些工作。
接下來,我們更進一步,輕鬆學懂Python中生成器是如何運作的以及如何定義它們。
如前一節所述,生成器是Python中一種特殊類型的函數。此函數不傳回單一值,而是傳回一個迭代器物件。在生成器函數中,傳回值使用yield語句而不是return語句。下面定義一個簡單的生成器函數,程式碼清單如下:
程式碼清單片段-01
在上述清單中,我們定義一個生成器函數。函數執行yield語句而不是return關鍵字。 yield語句使這個函數成為生成器。當我們呼叫這個函數時,它將返回(產生)一個迭代器物件。我們再來看看生成器的呼叫:
程式碼清單片段-02
呼叫生成器,通常就跟建立物件類似,呼叫生成器函數,並賦給變數。
執行程式輸出結果如下:
Yielding First Item A Yielding Second Item B Yielding Last Item C
在應用程式生成器程式碼中,我們呼叫firstGenerator()函數,它是一個生成器,並且傳回一個迭代器物件。我們將這個迭代器命名為myIter。然後在這個迭代器物件上呼叫next()函數。在每次next()呼叫中,迭代器會依照各自的順序執行yield語句並傳回一個項目。
根據規則,此生成器函數不應該包含return關鍵字。因為如果它包含,那麼return語句將終止此函數,也就無從滿足迭代器的要求了。
現在,讓我們透過for迴圈的幫助來定義一個更具有實際意義的生成器。在本例中,我們將定義一個生成器,它將連續追蹤產生從0開始的數字序列,直到給定的最大限制。
程式碼清單如下:
程式碼清單片段-03
執行程式輸出結果類似如下:
0 1 2 3
在上述清單中,我們定義一個生成器函數,它產生從0到給定數字的整數。如所見,yield語句在for迴圈中。請注意,n的值會自動儲存在連續的next()呼叫中。
有一點要注意,在定義生成器時,回傳值必須是yield語句,並不是說生成器不能出現return語句。只是通常把回傳非None值return語句放在生成器最後,為StopIteration 異常添加附加訊息,以便呼叫者處理。範例如下:
程式碼清單片段-04
下面是未進行例外處理時執行程式輸出結果類似如下:
99 100 Traceback (most recent call last): File "……", line 11, in <module> print(next(g)) StopIteration: 不支持大于100的数字生成!
若對程式進行了異常捕捉處理(try-except),顯示結果較簡明,自己執行試試看。
如果一个函数至少包含一个yield语句,那么它就是生成器函数。如果需要,还可以包含其他yield或return语句。yield和return关键字都将从函数中返回一些东西。
return和yield关键字之间的差异对于生成器来说非常重要。return语句会完全终止函数,而yield语句会暂停函数,保存它的所有状态,然后在后续的调用中继续执行。
我们调用生成器函数的方式和调用普通函数一样。但在执行过程中,生成器在遇到yield关键字时暂停。它将迭代器流的当前值发送到调用环境,并等待下一次调用。同时,它在内部保存局部变量及其状态。
以下是生成器函数与普通函数不同的关键点:
我们用一个简单的例子来演示普通函数和生成器函数之间的区别。在这个例子中,我们要计算前n个正整数的和。为此,我们将定义一个函数,该函数给出前n个正数的列表。我们将以两种方式实现这个函数,一个普通函数和一个生成器函数。
普通函数代码如下:
代码清单片段-05
运行程序输出结果类似如下:
49999995000000 Elapsed Time in seconds: 1.2067763805389404
在代码清单中,我们定义一个普通函数,它返回前n个正整数的列表。当我们调用这个函数时,它需要一段时间来完成执行,因为它创建的列表非常庞大。它还使用了大量内存来完成此任务。
现在让我们为相同的操作定义一个生成器函数来实现,代码清单如下:
代码清单片段-06
运行程序结果类似如下:
49999995000000 (生成器模式)Elapsed Time in seconds: 1.0013225078582764
正如在生成器清单中所见,生成器在更短的时间内完成相同的任务,并且使用更少的内存资源。因为生成器是一个一个地生成项,而不是返回完整的列表。
性能改进的主要原因(当我们使用生成器时)是值的惰性生成。这种按需值生成的方式,会降低内存使用量。生成器的另一个优点是,你不需要等到所有元素都生成后才开始使用它们。
有时候,我们需要简单的生成器来执行代码中相对简单的任务。这正是生成器表达式(Generator Expression)用武之地。可以使用生成器表达式轻松地动态创建简单的生成器。
生成器表达式类似于Python中的lambda函数。但要记住,lambda是匿名函数,它允许我们动态地创建单行函数。就像lambda函数一样,生成器表达式创建的是匿名生成器函数。
生成器表达式的语法看起来像一个列表推导式。不同之处在于,我们在生成器表达式中使用圆括号而不是方括号。请看示例:
运行结果类似如下:
49999995000000 (生成器模式)Elapsed Time in seconds: 1.0013225078582764
在上述清单中,我们在生成器表达式的帮助下定义了一个简单的生成器。下面是语法:cubes_gen = (i**3 for i in nums)。你可以在输出中看到生成器对象。正如所已经知的,为了能够在生成器中获取项,我们要么显式调用next()方法,要么使用for循环遍历生成器。接下来就打印cubes_gen对象中的项:
运行程序,遍历出的元素项结果是否和列表推导式一样。
我们再看一个例子。来定义一个生成器,将字符串中的字母转换为大写字母。然后调用next()方法打印前两个字母。代码示例如下:
运行输出结果如下:
M A
生成器是非常棒的工具,特别是当需要在相对有限的内存中处理大型数据时。以下是在Python中使用生成器的一些主要好处:
1)内存效率:
假设有一个返回结果非常大序列的普通函数。例如,一个包含数百万项的列表。你必须等待这个函数完成所有的执行,并将整个列表返回给你。就时间和内存资源而言,这显然是低效的。另一方面,如果你使用生成器函数,它将一个一个地返回项,你将有机会继续执行下一行代码。而不需要等待函数执行列表中的所有项。因为生成器一次只给你一项。
2)延迟计算:
生成器提供了延迟(惰性)计算求值的功能。延迟计算是在真正需要值时计算值,而不是在实例化时计算值。假设你有一个大数据集要计算,延迟计算允许你在整个数据集仍在计算生成中可立即开始使用数据。因为如果使用生成器,则不需要整个数据集。
3)易实现和可读性:
生成器非常容易实现,并且提供了好的代码可读性。记住,如果你使用生成器,你不需要担心__iter__()和__next__()方法。你所需要的只是函数中一个简单的yield语句。
4)处理无限流:
当你需要表示无限的数据流时,生成器是非常棒的工具。例如,一个无限计数器。理论上,你不能在内存中存储无限流的,因为你无法确定存储无限流需要多少的内存大小。这是生成器真正发挥作用的地方,因为它一次只产生一项,它可以表示无限的数据流。它不需要将所有的数据流存储在内存中。
主要介绍了生成器相关知识,用于更好的自定义迭代器。内容包括何为生成器?如何自定义生成器以及和普通函数的关键区别?如何实现生成器表达式?并总结了生成器的有点。通过这篇文章,相信你能更轻松高效的掌握Python常规的生成器方方面面。
以上是Python程式設計:如何搞定生成器(Generator)及表達式?來盤它!的詳細內容。更多資訊請關注PHP中文網其他相關文章!