題圖:https:///@shwetha for...in 是Python程序員使用最多的語句,for 循環(huán)用于迭代容器對(duì)象中的元素,這些對(duì)象可以是列表、元組、字典、集合、文件,甚至可以是自定義類或者函數(shù),例如:
作用于列表 >>> for elem in [1,2,3]: ... print(elem) ... 1 2 3
作用于元組 >>> for i in ('zhang', 'san', 30): ... print(i) ... zhang san 30
作用于字符串 >>> for c in 'abc':... print(c)...abc
作用于集合 >>> for i in {'a','b','c'}: ... print(i) ... b a c
作用于字典 >>> for k in {'age':10, 'name':'wang'}: ... print(k) ... age name
作用于文件 >>> for line in open('requirement.txt'): ... print(line, end='') ... Fabric==1.12.0 Markdown==2.6.7
可能有人不經(jīng)要問,為什么這么多不同類型對(duì)象都支持 for 語句,還有哪些類型的對(duì)象可以作用在 for 語句中呢?回答這個(gè)問題之前,我們先要了解 for 循環(huán)背后的執(zhí)行原理。 for 循環(huán)是對(duì)容器進(jìn)行迭代的過程,什么是迭代?迭代就是從某個(gè)容器對(duì)象中逐個(gè)地讀取元素,直到容器中沒有更多元素為止。那么,哪些對(duì)象支持迭代操作?任何對(duì)象都可以嗎?先隨便自定義一個(gè)類試試,看行不行: >>> class MyRange: ... def __init__(self, num): ... self.num = num ... >>> for i in MyRange(10): ... print(i) ... Traceback (most recent call last): File '', line 1, in TypeError: 'MyRange' object is not iterable
錯(cuò)誤堆棧日志非常清楚地告訴我們,MyRange 不是一個(gè)可迭代對(duì)象,所以它不能用于迭代,到底什么樣的對(duì)象才稱得上是可迭代對(duì)象(iterable)呢? 可迭代對(duì)象需要實(shí)現(xiàn)__iter__ 方法,并返回一個(gè)迭代器,迭代器(Iterator)只需要實(shí)現(xiàn) __next__ 方法?,F(xiàn)在我們就來驗(yàn)證一下列表為什么支持迭代: >>> x = [1,2,3] >>> its = x.__iter__() # x有此方法,說明列表是可迭代對(duì)象 >>> its 0x100f32198>
>>> its.__next__() # its有此方法,說明its是迭代器 1 >>> its.__next__() 2 >>> its.__next__() 3 >>> its.__next__() Traceback (most recent call last): File '', line 1, in StopIteration
從試驗(yàn)結(jié)果來看,列表是一個(gè)可迭代對(duì)象,因?yàn)樗鼘?shí)現(xiàn)了 __iter__ 方法,并且返回了一個(gè)迭代器對(duì)象(list_iterator),因?yàn)樗鼘?shí)現(xiàn)了 __next__ 方法。我們看到它不斷地調(diào)用__next__方法,其實(shí)就是不斷地迭代獲取容器中的元素,直到容器中沒有更多元素拋出 StopIteration 異常為止。 那么 for 語句又是如何循環(huán)的呢?到這里,恐怕你也猜到了,它的步驟是: 先判斷對(duì)象是否為可迭代對(duì)象,不是的話直接報(bào)錯(cuò),拋出TypeError異常,是的話,調(diào)用 __iter__ 方法,返回一個(gè)迭代器 不斷地調(diào)用迭代器的__next__ 方法,每次按序返回迭代器中的一個(gè)值 迭代到最后,沒有更多元素了,就拋出異常 StopIteration,這個(gè)異常 python 自己會(huì)處理,不會(huì)暴露給開發(fā)者
對(duì)于元組,字典,字符串也是同樣的道理,弄明白了 for 的執(zhí)行原理之后,我們就可以實(shí)現(xiàn)自己的迭代器用在 for 循環(huán)中。 前面的 MyRange 報(bào)錯(cuò)是因?yàn)樗鼪]有實(shí)現(xiàn)迭代器協(xié)議里面的這兩個(gè)方法,現(xiàn)在繼續(xù)改進(jìn): class MyRange: def __init__(self, num): self.i = 0 self.num = num
def __iter__(self): return self
def __next__(self): if self.i <> i = self.i self.i += 1 return i else: # 達(dá)到某個(gè)條件時(shí)必須拋出此異常,否則會(huì)無止境地迭代下去 raise StopIteration()
因?yàn)樗鼘?shí)現(xiàn)了__next__ 方法,所以 MyRange 本身已經(jīng)是一個(gè)迭代器了,所以 __iter__ 返回的就是對(duì)象本身 self。現(xiàn)在用在 for 循環(huán)中試試: for i in MyRange(3): print(i) # 輸出 0 1 2
你會(huì)發(fā)現(xiàn) MyRange 功能和內(nèi)建函數(shù) range 很相似。for 循環(huán)本質(zhì)是不斷地調(diào)用迭代器的__next__ 方法,直到出現(xiàn) StopIteration 異常退出循環(huán)。所以任何可迭代對(duì)象都可以作用在for循環(huán)中。Python愛好者社區(qū)歷史文章大合集: Python愛好者社區(qū)歷史文章列表(每周append更新一次)
|