必須了解的Linux系統(tǒng)中的進(jìn)程調(diào)度
操作系統(tǒng)要實現(xiàn)多進(jìn)程,進(jìn)程調(diào)度必不可少。有人說,進(jìn)程調(diào)度是操作系統(tǒng)中最為重要的一個部分。我覺得這種說法說得太絕對了一點,就像很多人動輒就說"某某函數(shù)比某某函數(shù)效率高XX倍"一樣,脫離了實際環(huán)境,這些結(jié)論是比較片面的。
而進(jìn)程調(diào)度究竟有多重要呢? 首先,我們需要明確一點:進(jìn)程調(diào)度是對TASK_RUNNING狀態(tài)的進(jìn)程進(jìn)行調(diào)度。如果進(jìn)程不可執(zhí)行(正在睡眠或其他),那么它跟進(jìn)程調(diào)度沒多大關(guān)系。
所以,如果你的系統(tǒng)負(fù)載非常低,盼星星盼月亮才出現(xiàn)一個可執(zhí)行狀態(tài)的進(jìn)程。那么進(jìn)程調(diào)度也就不會太重要。哪個進(jìn)程可執(zhí)行,就讓它執(zhí)行去,沒有什么需要多考慮的。
反之,如果系統(tǒng)負(fù)載非常高,時時刻刻都有N多個進(jìn)程處于可執(zhí)行狀態(tài),等待被調(diào)度運行。那么進(jìn)程調(diào)度程序為了協(xié)調(diào)這N個進(jìn)程的執(zhí)行,必定得做很多工作。協(xié)調(diào)得不好,系統(tǒng)的性能就會大打折扣。這個時候,進(jìn)程調(diào)度就是非常重要的。
盡管我們平常接觸的很多計算機(jī)(如桌面系統(tǒng)、網(wǎng)絡(luò)服務(wù)器、等)負(fù)載都比較低,但是linux作為一個通用操作系統(tǒng),不能假設(shè)系統(tǒng)負(fù)載低,必須為應(yīng)付高負(fù)載下的進(jìn)程調(diào)度做精心的設(shè)計。
當(dāng)然,這些設(shè)計對于低負(fù)載(且沒有什么實時性要求)的環(huán)境,沒多大用。極端情況下,如果CPU的負(fù)載始終保持0或1(永遠(yuǎn)都只有一個進(jìn)程或沒有進(jìn)程需要在CPU上運行),那么這些設(shè)計基本上都是徒勞的。
優(yōu)先級
現(xiàn)在的操作系統(tǒng)為了協(xié)調(diào)多個進(jìn)程的“同時”運行,最基本的手段就是給進(jìn)程定義優(yōu)先級。定義了進(jìn)程的優(yōu)先級,如果有多個進(jìn)程同時處于可執(zhí)行狀態(tài),那么誰優(yōu)先級高誰就去執(zhí)行,沒有什么好糾結(jié)的了。
那么,進(jìn)程的優(yōu)先級該如何確定呢?有兩種方式:由用戶程序指定、由內(nèi)核的調(diào)度程序動態(tài)調(diào)整。(下面會說到)
linux內(nèi)核將進(jìn)程分成兩個級別:普通進(jìn)程和實時進(jìn)程。實時進(jìn)程的優(yōu)先級都高于普通進(jìn)程,除此之外,它們的調(diào)度策略也有所不同。
實時進(jìn)程的調(diào)度
實時,原本的涵義是“給定的操作一定要在確定的時間內(nèi)完成”。重點并不在于操作一定要處理得多快,而是時間要可控(在最壞情況下也不能突破給定的時間)。
這樣的“實時”稱為“硬實時”,多用于很精密的系統(tǒng)之中(比如什么火箭、導(dǎo)彈之類的)。一般來說,硬實時的系統(tǒng)是相對比較專用的。
像linux這樣的通用操作系統(tǒng)顯然沒法滿足這樣的要求,中斷處理、虛擬內(nèi)存、等機(jī)制的存在給處理時間帶來了很大的不確定性。硬件的cache、磁盤尋道、總線爭用、也會帶來不確定性。
比如考慮“i++;”這么一句C代碼。絕大多數(shù)情況下,它執(zhí)行得很快。但是極端情況下還是有這樣的可能:
1、i的內(nèi)存空間未分配,CPU觸發(fā)缺頁異常。而linux在缺頁異常的處理代碼中試圖分配內(nèi)存時,又可能由于系統(tǒng)內(nèi)存緊缺而分配失敗,導(dǎo)致進(jìn)程進(jìn)入睡眠;
2、代碼執(zhí)行過程中硬件產(chǎn)生中斷,linux進(jìn)入中斷處理程序而擱置當(dāng)前進(jìn)程。而中斷處理程序的處理過程中又可能發(fā)生新的硬件中斷,中斷永遠(yuǎn)嵌套不止……;
等等……
而像linux這樣號稱實現(xiàn)了“實時”的通用操作系統(tǒng),其實只是實現(xiàn)了“軟實時”,即盡可能地滿足進(jìn)程的實時需求。
如果一個進(jìn)程有實時需求(它是一個實時進(jìn)程),則只要它是可執(zhí)行狀態(tài)的,內(nèi)核就一直讓它執(zhí)行,以盡可能地滿足它對CPU的需要,直到它完成所需要做的事情,然后睡眠或退出(變?yōu)榉强蓤?zhí)行狀態(tài))。
而如果有多個實時進(jìn)程都處于可執(zhí)行狀態(tài),則內(nèi)核會先滿足優(yōu)先級最高的實時進(jìn)程對CPU的需要,直到它變?yōu)榉强蓤?zhí)行狀態(tài)。
于是,只要高優(yōu)先級的實時進(jìn)程一直處于可執(zhí)行狀態(tài),低優(yōu)先級的實時進(jìn)程就一直不能得到CPU;只要一直有實時進(jìn)程處于可執(zhí)行狀態(tài),普通進(jìn)程就一直不能得到CPU。
那么,如果多個相同優(yōu)先級的實時進(jìn)程都處于可執(zhí)行狀態(tài)呢?這時就有兩種調(diào)度策略可供選擇:
1、SCHED_FIFO:先進(jìn)先出。直到先被執(zhí)行的進(jìn)程變?yōu)榉强蓤?zhí)行狀態(tài),后來的進(jìn)程才被調(diào)度執(zhí)行。在這種策略下,先來的進(jìn)程可以執(zhí)行sched_yield系統(tǒng)調(diào)用,自愿放棄CPU,以讓權(quán)給后來的進(jìn)程;
2、SCHED_RR:輪轉(zhuǎn)調(diào)度。內(nèi)核為實時進(jìn)程分配時間片,在時間片用完時,讓下一個進(jìn)程使用CPU;
強(qiáng)調(diào)一下,這兩種調(diào)度策略以及sched_yield系統(tǒng)調(diào)用都僅僅針對于相同優(yōu)先級的多個實時進(jìn)程同時處于可執(zhí)行狀態(tài)的情況。
















 
 
 






 
 
 
 