浅谈Python中的可迭代对象、迭代器、For循环工作机制、生成器


Posted in Python onMarch 11, 2019

1.iterable iterator区别

要了解两者区别,先要了解一下迭代器协议:
迭代器协议是指:对象需要提供__next__()方法,它返回迭代中的元素,在没有更多元素后,抛出StopIteration异常,终止迭代。
可迭代对象就是:实现了迭代器协议的对象。
协议是一种约定,可迭代对象实现迭代器协议,Python的内置工具(如for循环,sum,min,max函数等)通过迭代器协议访问对象,因此,for循环并不需要知道对象具体是什么,只需要知道对象能够实现迭代器协议即可。
迭代器(iterator)与可迭代对象(iterable)并不是同一个概念。

直观上:

1.可迭代对象(iterable):凡是具有__iter__的方法的类,都是可迭代的类。可迭代类创建的对象实现了__iter__方法,因此就是可迭代对象。用list、tuple等容器创建的对象,都是可迭代对象。可迭代对象通过__iter__方法返回一个迭代器,然后在内部调用__next__方法进行迭代,最后没有元素时,抛出异常(这个异常python自己会处理,不会让开发者看见)。

2.迭代器(iterator):迭代器对象必须同时实现__iter__和__next__方法才是迭代器。对于迭代器来说,__iter__ 返回的是它自身 self,__next__ 则是返回迭代器中的下一个值,最后没有元素时,抛出异常(异常可以被开发者看到)。

从上面2点可以看出:

1.迭代器一定是可迭代对象,因为它实现了__iter__()方法;

2.通过iter()方法(在类的内部就是__iter__)能够使一个可迭代对象返回一个迭代器。

3.迭代器的 __iter__ 方法返回的是自身,并不产生新的迭代器对象。而可迭代对象的 __iter__ 方法通常会返回一个新的迭代器对象。

第3点性质正是可迭代对象可以重复遍历的原因(每次返回一个独立的迭代器,就可以保证不同的迭代过程不会互相影响);而迭代器由于返回自身,因此只能遍历一次。

上面3点可以通过下面的例子看出来:

from collections import Iterable
from collections import Iterator
print isinstance(iter([1,2]),Iterator)
print isinstance(iter([1,2]),Iterable)
print isinstance([1,2],Iterator)
print isinstance([1,2],Iterable)
##result
True
True
False
True
##id可以查看一个对象在内存中的地址
test=[1,2,3]
testIter=iter(test)
print id(testIter)
print id(testIter)
print id(iter(test))
print id(iter(test))
print id(test.__iter__())
print id(test.__iter__())
##result:可迭代对象每次调用iter方法都会返回一个新的迭代器对象,而迭代器对象调用iter方法返回自身
67162576 
67162576 
67162688 
67162632 
67162856 
67163024

2.iterable的工作机制

拿一个例子看看,首先定义一个有__iter__方法,但是没有next()方法的类 (PS:在python2中是next(),python3是__next__()):

from collections import Iterable, Iterator
class Student(object):
 def __init__(self,score):
 self.score=score
 def __iter__(self):
 return iter(self.score)
 
test= Student([80,90,95])
print isinstance(test, Iterable)
print isinstance(test, Iterator)
for i in test:
 print i
##result
True
False
80
90
95
##可重复遍历
for i in test:
 print i
##result
80
90
95

上面代码的结果印证了定义中提到的:

缺少了next()方法,可迭代对象就不是迭代器。

此外,注意到:可迭代对象通过__iter__方法每次都返回了一个独立的迭代器,这样就可以保证不同的迭代过程不会互相影响。

也就是说,通过iterable可以实现重复遍历,而迭代器是无法重复遍历的!

因此,如果想要把可迭代对象转变为迭代器,可以先调用iter()方法返回一个迭代器。然后就可以用next()不断迭代了!

print isinstance(iter(test),Iterator)
testIter=iter(test)
print testIter.next()
print testIter.next()
print testIter.next()
##result
True
80
90
95
##一旦取完了可迭代对象中所有的元素,再次调用next就会发生异常
print testIter.next()
##result
StopIteration:

3.迭代器Iterator的工作机制

看下面这个例子:

class Student(object):
 def __init__(self,score):
 self.score=score
 def __iter__(self):
 return self
 
 def next(self):
 if self.score<100:
 self.score+=1
 return self.score
 else:
 raise StopIteration()
 
test= Student(90)
print isinstance(test, Iterable)
print isinstance(test, Iterator)
print test.next()
print test.next()
print test.next()
for i in test:
 print i
##result
True
True
91
92
93
94
95
96
97
98
99
100
##如果此时再对test这个迭代器调用next方法,就会抛出异常
test.next()
##result
StopIteration:

这个例子印证了定义中的:迭代器对象必须同时实现__iter__和__next__方法才是迭代器。

那么,使用迭代器好处在哪呢?

Python的Iterator对象表示的是一个数据流,Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会计算。

一个很常见的应用就是:Python在处理列表的时候,是直接把整个列表读进内存的,当遇到大量样本时的时候会变得很慢。而迭代器的优势在于只把需要的元素读进内存,因此占用内存更少。

换句话说,迭代器是一种惰性求值模式,它是有状态的,只有在调用时才返回值,没有调用的时候就等待下一次调用。这样就节省了大量内存空间。

这个例子印证了定义中的:迭代器对象必须同时实现__iter__和__next__方法才是迭代器。

那么,使用迭代器好处在哪呢?

Python的Iterator对象表示的是一个数据流,Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会计算。

一个很常见的应用就是:Python在处理列表的时候,是直接把整个列表读进内存的,当遇到大量样本时的时候会变得很慢。而迭代器的优势在于只把需要的元素读进内存,因此占用内存更少。

换句话说,迭代器是一种惰性求值模式,它是有状态的,只有在调用时才返回值,没有调用的时候就等待下一次调用。这样就节省了大量内存空间。

4.for循环的工作机制

有了上面2个例子,就可以总结一下在可迭代对象与迭代器中的For循环工作机制了。

当对象本身就是迭代器时,For循环工作机制:

  1. 调用 __iter__方法,返回自身self,也就是返回迭代器。
  2. 不断地调用迭代器的next()方法,每次按序返回迭代器中的一个值。
  3. 迭代到最后没有元素时,就抛出异常 StopIteration

在可迭代对象中,for循环工作机制:

  1. 先判断对象是否为可迭代对象(等价于判断有没有__iter__或__getitem__方法),没有的话直接报错,抛出TypeError异常。有的话,调用 __iter__方法,返回一个迭代器。
  2. 在python内部不断地调用迭代器的__next__方法,每次按序返回迭代器中的一个值。
  3. 迭代到最后没有元素时,就抛出异常 StopIteration,这个异常 python 自己会处理,不会暴露给开发者。

借用网络上的一张图直观理解一下:

浅谈Python中的可迭代对象、迭代器、For循环工作机制、生成器

此外,还要注意,python中的for循环其实兼容了两种机制:

  1. 如果对象有__iter__会返回一个迭代器。
  2. 如果对象没有__iter__,但是实现了__getitem__,会改用下标迭代的方式。
  3. __getitem__可以帮助一个对象进行取数和切片操作。

当for发现没有__iter__但是有__getitem__的时候,会从0开始依次读取相应的下标,直到发生IndexError为止,这是一种旧的迭代协议。iter方法也会处理这种情况,在不存在__iter__的时候,返回一个下标迭代的iterator对象来代替。一个重要的例子是str,字符串就是没有__iter__方法的,但是却依然可以迭代,原因就是其在for循环时调用了__getitem__方法。

看一个例子:

from collections import Iterable, Iterator
class Student(object):
 def __init__(self,score):
 self.score=score
 def __getitem__(self,n):
 return self.score[n]
 
test= Student([80,90,95])
print isinstance(test, Iterable)
print isinstance(test, Iterator)
print isinstance(iter(test), Iterable)
print isinstance(iter(test), Iterator)
for i in test:
 print i
##result
False
False
True
True
80
90
95
for i in range(0,3):
 print test[i]
##result
80
90
95
for i in iter(test):
 print i
##result
80
90
95

可以看到,实现了__getitem__方法的对象本身,尽管不是iterable与iterator,仍旧是可以调用for循环的。
通过iter方法,返回一个下标迭代的iterator对象。

5.generator的原理

最后说一下生成器,生成器是一种特殊的迭代器,当然也是可迭代对象。
对于生成器,Python会自动实现迭代器协议,以便应用到迭代中(如for循环,sum函数)。由于生成器自动实现了迭代器协议,所以,我们可以调用它的next方法,并且,在没有值可以返回的时候,生成器自动产生StopIteration异常。
创建生成器的方法:将return 改为yield。具体的实现网络上教程很多,不细说了。

6.总结

到一幅图片很好的描述了本文的所有内容,就拿它作为文末的总结吧!

浅谈Python中的可迭代对象、迭代器、For循环工作机制、生成器

以上所述是小编给大家介绍的Python中的可迭代对象、迭代器、For循环工作机制、生成器详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python使用tablib生成excel文件的简单实现方法
Mar 16 Python
Python实现拷贝多个文件到同一目录的方法
Sep 19 Python
Python如何实现守护进程的方法示例
Feb 08 Python
TF-IDF与余弦相似性的应用(一) 自动提取关键词
Dec 21 Python
Python遍历numpy数组的实例
Apr 04 Python
python处理数据,存进hive表的方法
Jul 04 Python
Django 实现购物车功能的示例代码
Oct 08 Python
Python对HTML转义字符进行反转义的实现方法
Apr 28 Python
Python搭建代理IP池实现获取IP的方法
Oct 27 Python
python实现连连看游戏
Feb 14 Python
详解Django ORM引发的数据库N+1性能问题
Oct 12 Python
使用Python判断一个文件是否被占用的方法教程
Dec 16 Python
python使用selenium实现批量文件下载
Mar 11 #Python
利用Python实现微信找房机器人实例教程
Mar 10 #Python
谈谈Python中的while循环语句
Mar 10 #Python
15行Python代码实现网易云热门歌单实例教程
Mar 10 #Python
Python如何爬取实时变化的WebSocket数据的方法
Mar 09 #Python
浅谈python的深浅拷贝以及fromkeys的用法
Mar 08 #Python
Python高级特性与几种函数的讲解
Mar 08 #Python
You might like
php中使用DOM类读取XML文件的实现代码
2011/12/14 PHP
javascript实现unicode和字符的互相转换
2007/07/18 Javascript
js实现简单折叠、展开菜单的方法
2015/08/28 Javascript
js实现基于正则表达式的轻量提示插件
2015/08/29 Javascript
一个极为简单的requirejs实现方法
2016/10/20 Javascript
微信小程序 解决请求服务器手机预览请求不到数据的方法
2017/01/04 Javascript
bootstrap PrintThis打印插件使用详解
2017/02/20 Javascript
jquery插件ContextMenu设置右键菜单
2017/03/13 Javascript
微信小程序开发图片拖拽实例详解
2017/05/05 Javascript
Angularjs添加排序查询功能的实例代码
2017/10/24 Javascript
JavaScript数据结构之双向链表定义与使用方法示例
2017/10/27 Javascript
详解Vue一个案例引发「内容分发slot」的最全总结
2018/12/02 Javascript
微信小程序上传多图到服务器并获取返回的路径
2019/05/05 Javascript
jQuery操作元素追加内容示例
2020/01/10 jQuery
[01:05:40]2014 DOTA2国际邀请赛中国区预选赛 5 23 CIS VS DT第三场
2014/05/24 DOTA
[04:03]DOTA2英雄梦之声_第02期_风暴之灵
2014/06/30 DOTA
[06:11]2014DOTA2国际邀请赛 专访团结一心的VG战队
2014/07/21 DOTA
[05:23]DOTA2-DPC中国联赛2月1日Recap集锦
2021/03/11 DOTA
python执行get提交的方法
2015/04/29 Python
详解Python的Django框架中的模版相关知识
2015/07/15 Python
在Python的Django框架中生成CSV文件的方法
2015/07/22 Python
python数据结构链表之单向链表(实例讲解)
2017/07/25 Python
python 通过 socket 发送文件的实例代码
2018/08/14 Python
django2笔记之路由path语法的实现
2019/07/17 Python
浅谈pytorch、cuda、python的版本对齐问题
2020/01/15 Python
通过python实现windows桌面截图代码实例
2020/01/17 Python
Tensorflow矩阵运算实例(矩阵相乘,点乘,行/列累加)
2020/02/05 Python
pip install命令安装扩展库整理
2021/03/02 Python
粉红色的鲸鱼:Vineyard Vines
2018/02/17 全球购物
什么是Connection-oriented Protocol/Connectionless Protocol面向连接的协议/无连接协议
2012/09/06 面试题
什么是反射
2012/03/17 面试题
护理学应聘自荐书范文
2014/02/05 职场文书
2014植树节活动总结
2014/03/11 职场文书
财政专业大学生职业生涯规划书
2014/09/17 职场文书
2016年中学端午节主题活动总结
2016/04/01 职场文书
Mysql中 unique列插入重复值该怎么解决呢
2021/05/26 MySQL