偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

重新認識生成器Generator

開發(fā) 前端
我們知道,函數(shù)體包含 yield 關(guān)鍵字的函數(shù)不是一個普通函數(shù)。這種函數(shù)叫做 生成器 ( generator ),一般用于循環(huán)處理結(jié)構(gòu),應(yīng)用得當可以極大優(yōu)化內(nèi)存使用效率。

 [[395138]]

本文轉(zhuǎn)載自微信公眾號「小菜學編程」,作者fasionchan。轉(zhuǎn)載本文請聯(lián)系小菜學編程公眾號。

基本用法

我們知道,函數(shù)體包含 yield 關(guān)鍵字的函數(shù)不是一個普通函數(shù)。這種函數(shù)叫做 生成器 ( generator ),一般用于循環(huán)處理結(jié)構(gòu),應(yīng)用得當可以極大優(yōu)化內(nèi)存使用效率。例如,設(shè)計一個函數(shù),打開文件并將每一行轉(zhuǎn)成大寫并返回:

  1. def read_file_upper(path): 
  2.     lines = [] 
  3.     with open(path) as f: 
  4.         for line in f: 
  5.             lines.append(line.upper()) 
  6.     return lines 

這個版本的函數(shù),在內(nèi)部創(chuàng)建了一個 list 對象,用于保存轉(zhuǎn)換結(jié)果。for 循環(huán)則遍歷文件每一行,將其轉(zhuǎn)成大寫并追加到列表中。這樣一來,文件中的每一行均需要保存在列表中,如果文件很大,內(nèi)存開銷可想而知。

我們可以借助 yield 關(guān)鍵字,將 read_file_upper 函數(shù)改成生成器版本。函數(shù)主體邏輯沒有任何變化,只是將每行數(shù)據(jù)的處理結(jié)果通過 yield 逐個返回,而不是收集到 list 對象后再返還。

  1. def iter_file_upper(path): 
  2.     with open(path) as f: 
  3.         for line in f: 
  4.             yield line.upper() 

如果現(xiàn)在有一個文本文件 data.txt ,里面包含以下內(nèi)容:

  1. hello, world 
  2. life is short, use python 
  3. my wechat id is: coding-fan 
  4. bye 

用 iter_file_upper 生成器,我們可以這樣對它進行處理:

  1. >>> for line in iter_file_upper('text.txt'): 
  2. ...     print(line.strip()) 
  3. HELLO, WORLD 
  4. LIFE IS SHORT, USE PYTHON 
  5. MY WECHAT ID IS: CODING-FAN 
  6. BYE 

iter_file_upper 生成器用法與 read_file_upper 函數(shù)大致相同,但它不會一次性拿住文件所有數(shù)據(jù)行,而是逐行處理、逐個返回,這樣便將內(nèi)存使用量降到最低。

行為觀察

那么,生成器為什么會有這樣的奇效呢?我們接著觀察:

  1. >>> g = iter_file_upper('text.txt'
  2. >>> g 
  3. <generator object iter_file_upper at 0x103becd68> 

我們調(diào)用 iter_file_upper 后,得到一個生成器對象,而不是文件處理結(jié)果,這時 iter_file_upper 還未開始執(zhí)行。

當我們調(diào)用 next 函數(shù)從生成器接收下一個數(shù)據(jù)時,iter_file_upper 開始執(zhí)行并在 yield 處停下來,并把第一行的處理結(jié)果返回給我們:

  1. >>> next(g) 
  2. 'HELLO, WORLD\n' 

這時,生成器處于暫停狀態(tài),沒有我們的指令,它不會接著處理第二行數(shù)據(jù)。

當我們再次執(zhí)行 next 函數(shù)時,生成器再次恢復(fù)執(zhí)行,處理下一行數(shù)據(jù)并在 yield 處再次暫停:

  1. >>> next(g) 
  2. 'LIFE IS SHORT, USE PYTHON\n' 

生成器記住了自己的執(zhí)行進度,每次調(diào)用 next 函數(shù),它總是處理并生產(chǎn)下一個數(shù)據(jù),完全不用我們瞎操心:

  1. >>> next(g) 
  2. 'MY WECHAT ID IS: CODING-FAN\n' 
  3. >>> next(g) 
  4. 'BYE\n' 

當 iter_file_upper 代碼邏輯執(zhí)行完畢,它將給 next 拋一個異常,以此通知調(diào)用者它已經(jīng)結(jié)束了:

  1. >>> next(g) 
  2. Traceback (most recent call last): 
  3.   File "<stdin>", line 1, in <module> 
  4. StopIteration 

因此,我們可以簡單認為 for-in 循環(huán)在 Python 虛擬機內(nèi)部是這樣實現(xiàn)的:

  • 不斷調(diào)用 next 函數(shù)讓生成器產(chǎn)出數(shù)據(jù);
  • 直到生成器拋出 StopIteration 異常;

在經(jīng)典的線程模型中,每個線程有一個獨立的執(zhí)行流,只能執(zhí)行一個任務(wù)。如果一個程序需要同時處理多個任務(wù),可以借助 多進程 或者 多線程 技術(shù)。假設(shè)一個站點需要同時服務(wù)多個客戶端連接,可以為每個連接創(chuàng)建一個獨立的線程進行處理。

不管線程還是進程,切換時都會帶來巨大的開銷:用戶態(tài)/內(nèi)核態(tài)切換、執(zhí)行上下文保存和恢復(fù)、CPU緩存刷新等等。因此,用線程或進程來驅(qū)動小任務(wù)的執(zhí)行,顯然不是一個理想的選擇。

那么,除了線程和進程,還有其他解決方案嗎?

 

責任編輯:武曉燕 來源: 小菜學編程
相關(guān)推薦

2022-03-03 08:30:41

GeneratorES6函數(shù)

2014-01-06 11:23:54

Mesos設(shè)計架構(gòu)

2019-10-31 13:40:52

JavaPHP編程語言

2019-02-24 21:27:26

物聯(lián)網(wǎng)網(wǎng)關(guān)物聯(lián)網(wǎng)IOT

2016-11-07 11:34:28

數(shù)據(jù)可視化大數(shù)據(jù)

2016-12-13 15:41:40

JavaHashMap

2020-09-17 07:08:04

TypescriptVue3前端

2019-09-02 08:53:46

程序員

2021-11-11 05:00:02

JavaMmap內(nèi)存

2017-01-03 17:22:16

公共云安全

2019-01-18 13:32:16

2015-03-19 10:15:54

程序員價值程序員價值

2012-01-11 09:12:25

程序員

2010-10-22 11:10:24

軟考

2019-04-15 14:32:11

2022-10-09 11:46:55

機器人人工智能

2009-11-26 16:57:09

Cisco路由器ARP

2012-06-26 11:11:44

架構(gòu)師

2022-03-04 09:28:29

代碼訪問者模式軟件開發(fā)

2022-09-08 13:58:39

Spring高并發(fā)異步
點贊
收藏

51CTO技術(shù)棧公眾號