python中的生成器到底是个啥
【摘要】生成器,是一个用来创建迭代器的工具。它简单而强大,类似写函数那样进行定义,但是需要返回数据时不是使用return,而是使用yield语句。生
生成器,是一个用来创建迭代器的工具。它简单而强大,类似写函数那样进行定义,但是需要返回数据时不是使用return,而是使用yield语句。
生成器函数
用yield语句返回数据的“函数”,称为生成器函数。我们把上一节中自定义类LessThan改写成生成器函数
In [30]: def lessthan(n):
...: for i in range(n-1, -1, -1):
...: yield i
...:
...:
In [31]: for i in lessthan(5):
...: print(i)
...:
4
3
2
1
0
In [32]: lt = lessthan(3)
## 查看生成器对象的__iter__()和__next__():
In [33]: lt.__iter__?
Signature: lt.__iter__()
Call signature: lt.__iter__(*args, **kwargs)
Type: method-wrapper
String form: <method-wrapper '__iter__' of generator object at 0x7fc048cb8ba0>
Docstring: Implement iter(self).
In [34]: lt.__next__?
Signature: lt.__next__()
Call signature: lt.__next__(*args, **kwargs)
Type: method-wrapper
String form: <method-wrapper '__next__' of generator object at 0x7fc048cb8ba0>
Docstring: Implement next(self).
通过生成器改写LessThan类后,代码更加简洁紧凑,因为它自动创建了__iter__()和__next__()方法,通过for循环可以遍历生成器对象。
接下来我们定义一个生成器对象lt,对这个生成器对象调用next(),每一次调用它都会从上次离开的位置回复执行(也就是记住上次执行语句时的所有数据值)。当生成器生成了所有元素(生成器终结)就会引发StopIteration错误。
In [53]: lt = lessthan(3)
In [54]: next(lt)
Out[54]: 2
In [55]: next(lt)
Out[55]: 1
In [56]: next(lt)
Out[56]: 0
In [57]: next(lt)
---------------------------------------------------
StopIteration Traceback (most recent call last)
<ipython-input-37-00f31299a3f9> in <module>
----> 1 next(lt)
StopIteration:
生成器解析式
为了实现一些简单的生成器,我们可以不用函数的形式,而是用类似列表解析式的语法,将外层的方括号用圆括号代替即可。
生成器表达式相比完整的生成器更紧凑但较不灵活,相比等效的列表推导式则更为节省内存。比如下面的的代码,用列表表达式生成的mylist的每个元素都保存在内存中,而mygener每次迭代时才会产生一个元素。假设元素个数不是10,而是100万甚至更多,此时生成器的内存优势会非常明显。
In [41]: mylist = [i*i for i in range(10)]
In [42]: mylist
Out[42]: [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
In [43]: mygener = (i*i for i in range(10))
In [44]: mygener
Out[44]: <generator object <genexpr> at 0x7fc048be3bf8>
生成器解析式被设计用于生成器将立即被外层函数所使用的情况,比如:
In [45]: sum(i*i for i in range(10))
Out[45]: 285
sum()括号里面的i*i for i in range(10)就是一个生成器解析式,避免生成一个列表而占用过多内存。
同样的,下面的例子中都是使用了生成器解析式:
xvec = [10, 20, 30]
yvec = [7, 5, 3]
sum(x*y for x,y in zip(xvec, yvec)) # dot product
from math import pi, sin
sine_table = {x: sin(x*pi/180) for x in range(0, 91)}
unique_words = set(word for line in page for word in line.split())
valedictorian = max((student.gpa, student.name) for student in graduates)
data = 'golf'
list(data[i] for i in range(len(data)-1, -1, -1))
总结
Python提供了两种方式实现生成器:
(1)生成器函数
语法上与普通函数相似,用yield替代return换回值;自动实现迭代器协议:__iter__()方法和__next__()方法。没有值可返回时,引起StopInteration异常。yield语句挂起生成器函数的状态,以便再次迭代时从离开的状态继续执行。
(2)生成器解析式
类似列表解析式,用圆括号替换方括号,从而简单实现简单的生成器。
(3)生成器的优点
代码紧凑,节省内存。不像列表可以多次遍历,生成器只能遍历一遍。
就业培训申请领取
环球青藤
官方QQ群扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群
刷题看课 APP下载
免费直播 一键购课
代报名等人工服务