关于Python中的range 对象是不是迭代器的探讨

零到壹度
发布: 2018-04-02 14:28:45
原创
2656 人浏览过

迭代器(iterator)是惰性可迭代对象(lazy iterable),range 函数在 Python 3 中是一个惰性的可迭代对象,那么 range 是不是迭代器呢?为什么。

TLNR:Python 3 中的 range 对象(Python 2 中的 xrange 对象)是 lazy 的,但 range 对象却不是迭代器。



是的,这让人很困惑

当谈论 Python 中的迭代器(iterator)和可迭代对象(iterable)时,你很可能会听到有人重复 range 是迭代器的误解。我认为这是非常严重误解, 如果你认为 range 对象是迭代器,那么你关于「迭代器是如何运行」的心智模型还不够清楚。从某种意义上来说,range 和迭代器都是「惰性」的,但它们是以相当不同的方式实现「惰性」的。


什么是迭代器(iterator)

在 Python 中,可迭代对象就是你可以迭代的任何东西,而迭代器就是实际迭代的东西。

Iter-ables are able to be iterated over. Iter-ators are the agents that perform the iteration.

可以使用 iter 函数从任何可迭代对象中获取迭代器:

360截图20180402142325097.jpg

一旦有了迭代器,可以用它做的唯一的事情就是获得它的下一个元素:

360截图20180402142348225.jpg

如果没有更多的元素了, 则会抛出一个 stop iteration exception:

360截图20180402142409624.jpg

所有的迭代器都是可迭代对象,意思是你可以从一个迭代器中得到一个迭代器,因此你可以遍历一个迭代器:

360截图20180402142432168.jpg

应该指出的是迭代器是有状态的,在循环遍历一次迭代器后,如果尝试再次循环,它将为空:

360截图20180402142451282.jpg

在 Python 3 中,<span style="color: rgb(103, 103, 103);">enumerate、zip、reversed</span>和其他一些内置函数会返回迭代器:

360截图20180402142505393.jpg

生成器(无论来自生成器函数还是生成器表达式)是一种创建迭代器的简单方法:

360截图20180402142530097.jpg

我经常说迭代器是惰性的一次性可迭代对象。 「惰性」是因为他们只循环计算项目,「单次使用是因为一旦从一个迭代器中「消费」了一个元素之后,这个元素就永远消失了。


什么是 range

Python 3 中的 range 对象(Python 2 中的 xrange)可以像任何其他可迭代对象一样循环使用:

360截图20180402142555040.jpg

因为 range 是可迭代对象,所以可以从中得到一个迭代器:

f2a4c45edca4ad776dec08f851c2c3c1_640_wx_fmt=jpeg.jpg

但 range 对象本身不是迭代器,我们不能在 range 对象上调用 next:

d272462c617bbb2343927048a78f0acc_640_wx_fmt=jpeg.jpg

与迭代器不同的是,我们可以遍历一个 range 对象而不「消耗」它:

78b9b7bcdcfd8311217eddf94370e2ed_640_wx_fmt=jpeg.jpg

如果我们使用迭代器完成此操作,则第二次循环时不会得到任何元素:

594254f3b36088165232b56391941a27_640_wx_fmt=jpeg.jpg

宗上,与 <span style="color: rgb(103, 103, 103);">zip</span><span style="color: rgb(103, 103, 103);">enumerate</span>, or <span style="color: rgb(103, 103, 103);">generator</span>对象不同,range 对象不是迭代器。


那么,究竟 range 是什么

range 对象在某种意义上是「惰性的」,因为它不会生成创建时包含的每个数字,相反,当我们在循环中需要的时候,它才将这些数字返回给我们。

下面是一个 range 对象和一个生成器(是一种迭代器):

bf71c628c7b763250fbb476ed05f0fbb_640_wx_fmt=jpeg.jpg

不像生成器,range 对象有长度:

b832b3cfea96e9bdf15d01b5483be516_640_wx_fmt=jpeg.jpg

并且可以被索引:

bf240fc1b2fa3569835e2cdaf4c8c2bf_640_wx_fmt=jpeg.jpg

与迭代器不同,你可以询问他们是否包含某元素而不改变他们的状态:

69b757a6a321619c48ae27bfdd33b5d7_640_wx_fmt=jpeg.jpg

如果你想要一个 range 对象的描述,可以称它们为<span style="color: rgb(103, 103, 103);">懒序列</span>,range 是序列(如列表,元组和字符串),但并不包含任何内存中的内容,而是通过计算来回答问题。

bc66721ae72b6f5dba23973e65433c35_640_wx_fmt=jpeg.jpg


为什么这个区别很重要

如果我告诉你某个对象是一个迭代器,你会知道当在这个对象上调用 iter 函数时,总会得到相同的的对象(按照定义):

e1b59616414d402954842aa414bd3c00_640_wx_fmt=jpeg.jpg

确信可以在这个对象上调用 next 函数,因为可以在所有的迭代器上调用 next 函数:

9c3a0a98bbc79d00817ecb66c83f6e88_640_wx_fmt=jpeg.jpg

而且你会知道,当遍历它时,这些元素将从迭代器中被消耗掉,有时候这个特性可以派上用场(以特殊的方式处理迭代器):

02e7da49e553af09b9e1cb63ee1b1614_640_wx_fmt=jpeg.jpg

所以虽然看起来「惰性可迭代对象」和「迭代器」之间的区别很微妙,但这些术语确实意味着不同的东西。 虽然「惰性可迭代对象」是一个没有具体含义的非常普遍的术语,但「迭代器」这个词意味着一个具有非常特定行为的对象。


总结

如果你知道你可以循环遍历某个对象,这是一个可迭代对象(iterable)。

如果你知道你正在循环遍历的对象是在循环的时候计算出来,那么这是一个惰性可迭代对象(lazy iterable)。

如果你知道你可以传递一些东西给 next 函数,它就是一个迭代器(这是最常见的惰性可迭代对象)。

如果你可以循环多次而不用「耗尽」它,它不是一个迭代器。如果你不能将某些东西传递给 next 函数,那么它不是一个迭代器。 Python 3 的 range 对象不是迭代器。 如果你正在指导别人关于 range 对象的知识,请不要使用「迭代器」一词,这会让人十分困惑,并可能导致他人开始滥用「迭代器」这个词

相关推荐:

关于迭代器的详细说明

Python中可迭代对象和迭代器对象的理解

Range对象

以上是关于Python中的range 对象是不是迭代器的探讨的详细内容。更多信息请关注PHP中文网其他相关文章!

相关标签:
来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!