偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Python中實(shí)現(xiàn)多線程 Threading 和多進(jìn)程 Multiprocessing

開發(fā) 后端
最近正在和 ray 以及 spark 打交道,索性講一下并發(fā)和并行。反正大家都是管理學(xué)院的,平時(shí)很少接觸這種,因此這個(gè)選題不大可能因?yàn)閮?nèi)容基礎(chǔ)而貽笑大方。

[[405163]]

本文轉(zhuǎn)載自微信公眾號(hào)「Piper蛋窩」,作者Piper蛋 。轉(zhuǎn)載本文請聯(lián)系Piper蛋窩公眾號(hào)。

昨天晚上組會(huì)輪到我匯報(bào)技術(shù)內(nèi)容,最近正在和 ray 以及 spark 打交道,索性講一下并發(fā)和并行。反正大家都是管理學(xué)院的,平時(shí)很少接觸這種,因此這個(gè)選題不大可能因?yàn)閮?nèi)容基礎(chǔ)而貽笑大方。

本文擺一擺并發(fā)和并行。附上很簡單的 Python 代碼,涉及到自帶庫threading[1] 和 multiprocessing[2] 的使用。

并發(fā)和并行

咱們簡單用多線程對應(yīng)并發(fā),多進(jìn)程對應(yīng)并行。多線程并發(fā)更強(qiáng)調(diào)充分利用性能;多進(jìn)程并行更強(qiáng)調(diào)提升性能上限。

我用非常簡單且不那么嚴(yán)謹(jǐn)?shù)谋扔鱽碚f明。

多線程

一個(gè) CPU 相當(dāng)于一個(gè)學(xué)生。

一個(gè)學(xué)生一周開一次組會(huì),換句話說一周給老師匯報(bào)一次工作。

老師一般會(huì)給學(xué)生同時(shí)布置幾個(gè)任務(wù),比如做比賽、做項(xiàng)目、讀論文,學(xué)生可能周一做做比賽、周二讀讀論文、周三做做項(xiàng)目... 到了組會(huì),他就把三件事都拿出來匯報(bào),老師很欣慰,因?yàn)樵诶蠋煹囊暯抢铮簩W(xué)生這三件事是同時(shí)在做的。

多線程也是同一個(gè)道理,假設(shè)你的手機(jī)只有一塊單核 CPU 。你的 CPU 這 0.01 秒用來播放音樂,下 0.01 秒用來解析網(wǎng)頁... 在你的視角里:播放音樂和解析網(wǎng)頁是同時(shí)進(jìn)行的。你大可以暢快地邊聽音樂邊網(wǎng)上沖浪

何謂充分利用性能? 如果這學(xué)生只有一項(xiàng)工作,那他這一周可能只需要花費(fèi)兩天來做任務(wù),剩下時(shí)間摸魚(針不搓,三點(diǎn)鐘飲茶先!)。因此,我們用「多線程」來讓學(xué)生實(shí)現(xiàn)『并發(fā)』,充分利用學(xué)生能力。

 

在實(shí)際情況中,多線程、高并發(fā)這些詞語更多地出現(xiàn)在服務(wù)端程序里。比如一個(gè)網(wǎng)絡(luò)連接由一個(gè)線程負(fù)責(zé),一塊 CPU 可以負(fù)責(zé)處理多個(gè)異步的請求,大大提升了 CPU 利用率。

多進(jìn)程

多個(gè) CPU ( CPU 的多核)相當(dāng)于多個(gè)學(xué)生。

一個(gè)任務(wù)可以拆成幾個(gè)任務(wù)相互協(xié)作、同時(shí)進(jìn)行,則是多進(jìn)程。

比如研究生課程,老師非得留個(gè)論文作業(yè),都研究生了我去,留啥大作業(yè)。

那咱就多線程并行搞唄。確定了大概思路,剩下的一股腦寫就行。咱隊(duì)伍里一共甲乙丙丁四名同學(xué),那就:

  • 甲同學(xué)負(fù)責(zé) Introduction
  • 乙同學(xué)負(fù)責(zé) Background
  • 丙同學(xué)負(fù)責(zé) Related Works
  • 丁同學(xué)負(fù)責(zé) Methodology

這是乙同學(xué)提出異議:不應(yīng)該是先完成 Introduction 再寫 Background ,一個(gè)個(gè)來嘛?

大哥,都研究生了嗷,作業(yè)糊弄糊弄差不多得了啊。讓你寫你就寫。

可以預(yù)知,上述四部分同時(shí)進(jìn)行,怎么也比一個(gè)人寫四塊要快。

 

所以說 多進(jìn)程并行提升性能上限 。

在實(shí)際情況中,多進(jìn)程更多地與高性能計(jì)算、分布式計(jì)算聯(lián)系在一起。

Python 實(shí)現(xiàn)

首先聲明咱的實(shí)驗(yàn)環(huán)境。

  1. > python --version 
  2. Python 3.8.5 

咱們設(shè)置個(gè)任務(wù):求數(shù)的歐拉函數(shù)值。

  1. def euler_func(n: int) -> int
  2.     res = n 
  3.     i = 2 
  4.     while i <= n // i: 
  5.         if n % i == 0: 
  6.             res = res // i * (i - 1) 
  7.             while (n % i == 0): n = n // i 
  8.         i += 1 
  9.     if n > 1: 
  10.         res = res // n * (n - 1) 
  11.     return res 

求一個(gè)數(shù)的歐拉函數(shù)值可能很快,但是一堆數(shù)呢?

所以咱想著用并行完成這個(gè)任務(wù)。

咱們把任務(wù)分成三份。

  1. task1 = list(range(2, 50000, 3))  # 2, 5, ... 
  2. task2 = list(range(3, 50000, 3))  # 3, 6, ... 
  3. task3 = list(range(4, 50000, 3))  # 4, 7, ... 
  4.  
  5. def job(task: List): 
  6.     for t in task: 
  7.         euler_func(t) 

來看看平平無奇的正常串行。

  1. @timer 
  2. def normal(): 
  3.     job(task1) 
  4.     job(task2) 
  5.     job(task3) 

完成了 task1 再完成 task2 ... 行,沒毛病。

看看多線程?

  1. import threading as th 
  2.  
  3. @timer 
  4. def mutlthread(): 
  5.     th1 = th.Thread(target=job, args=(task1, )) 
  6.     th2 = th.Thread(target=job, args=(task2, )) 
  7.     th3 = th.Thread(target=job, args=(task3, )) 
  8.  
  9.     th1.start() 
  10.     th2.start() 
  11.     th3.start() 
  12.  
  13.     th1.join() 
  14.     th2.join() 
  15.     th3.join() 

再看看多進(jìn)程?

  1. import multiprocessing as mp 
  2.  
  3. @timer 
  4. def multcore(): 
  5.     p1 = mp.Process(target=job, args=(task1, )) 
  6.     p2 = mp.Process(target=job, args=(task2, )) 
  7.     p3 = mp.Process(target=job, args=(task3, )) 
  8.  
  9.     p1.start() 
  10.     p2.start() 
  11.     p3.start() 
  12.  
  13.     p1.join() 
  14.     p2.join() 
  15.     p3.join() 

上述代碼的邏輯是這樣的:

  • 我創(chuàng)建線程/進(jìn)程,其生來的目的就是完成任務(wù)job(task1)或job(task2)、job(task3),注意這里函數(shù)名和參數(shù)被分開了target=job, args=(task1, )
  • 然后 start() ,告訴線程/進(jìn)程:你可以開始干活了
  • 他們自己干自己的,咱們程序主邏輯還得繼續(xù)往下運(yùn)行
  • 到 join() 這里,咱們是指讓線程/進(jìn)程阻塞住咱的主邏輯,比如p1.join()是指:p1不干完活,我主邏輯不往下進(jìn)行(屬于是「阻塞」)
  • 這樣,我們的函數(shù)multcore結(jié)束后,一定其中的線程/進(jìn)程任務(wù)都完成了

咱看看結(jié)果:

  1. if __name__ == '__main__'
  2.  
  3.     print("同步串行:"
  4.     normal() 
  5.  
  6.     print("多線程并發(fā):"
  7.     mutlthread() 
  8.  
  9.     print("多進(jìn)程并行:"
  10.     multcore() 
  11.  
  12. # 下面是結(jié)果 
  13. 同步串行: 
  14. timer: using 0.24116 s 
  15. 多線程并發(fā): 
  16. timer: using 0.24688 s 
  17. 多進(jìn)程并行: 
  18. timer: using 0.13791 s 

結(jié)果不太對,按理說,多進(jìn)程并行的耗時(shí)應(yīng)該是同步串行的三分之一,畢竟三個(gè)同等體量的任務(wù)在同時(shí)進(jìn)行。

多線程并發(fā)比同步串行慢是應(yīng)該的,因?yàn)槎嗑€程并發(fā)和同步串行的算力是一樣的,但是多線程并發(fā)得在各個(gè)任務(wù)間來回切換,導(dǎo)致更慢。

你問 @timer 是什么意思?哦,這個(gè)是我寫的修飾器,如下。

  1. def timer(func): 
  2.     @wraps(func) 
  3.     def inner_func(): 
  4.         t = time.time() 
  5.         rts = func() 
  6.         print(f"timer: using {time.time() - t :.5f} s"
  7.         return rts 
  8.     return inner_func 

 

不太明白『Python修飾器』的老鐵,不如給我點(diǎn)個(gè)「在看」,再關(guān)注下我,咱們以后詳細(xì)道來。

 

責(zé)任編輯:武曉燕 來源: Piper蛋窩
相關(guān)推薦

2021-04-20 12:39:52

Node.js多線程多進(jìn)程

2022-03-09 17:01:32

Python多線程多進(jìn)程

2021-08-04 23:30:28

Node.js開發(fā)線程

2023-12-11 18:18:24

Python編程線程

2023-11-28 13:52:00

Python多進(jìn)程多線程

2020-04-07 11:10:30

Python數(shù)據(jù)線程

2019-02-26 11:15:25

進(jìn)程多線程多進(jìn)程

2017-01-10 13:39:57

Python線程池進(jìn)程池

2024-01-15 10:55:40

Python多線程開發(fā)

2010-07-26 09:45:09

Perl多進(jìn)程

2023-12-13 09:56:13

?多進(jìn)程多線程協(xié)程

2023-05-10 07:47:08

Python并發(fā)編程

2023-11-01 11:20:57

2016-10-09 20:15:30

多線程多進(jìn)程

2021-09-10 21:25:43

Redis分布式

2022-01-04 09:53:37

Python多線程多進(jìn)程

2024-12-27 08:11:44

Python編程模式IO

2024-09-29 10:39:14

并發(fā)Python多線程

2013-12-02 17:33:20

Linux進(jìn)程多線程

2019-08-12 16:22:07

Python線程場景
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)