偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<button id="2bo8h"></button>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

Linux實時補丁即將合并進Linux 5.3

作者：JeffXie 2021-05-06 21:06:37

系統(tǒng) Linux

Linux PREEMPT_RT 補丁終于要合并進Linux 5.3了。意味著開發(fā)了十幾年的實時補丁將得以和主線Linux 協(xié)同發(fā)展。

本文轉(zhuǎn)載自微信公眾號「相遇Linux」，作者JeffXie。轉(zhuǎn)載本文請聯(lián)系相遇Linux公眾號。

Linux PREEMPT_RT 補丁終于要合并進Linux 5.3了。意味著開發(fā)了十幾年的實時補丁將得以和主線Linux 協(xié)同發(fā)展。

以下文章改編自楊燚的 Linux 實時技術與典型實現(xiàn)分析(文尾鏈接)

一、實時的概念

所謂實時，就是一個特定任務的執(zhí)行時間必須是確定的，可預測的，并且在任何情況下都能保證任務的時限(最大執(zhí)行時間限制)。實時又分軟實時和硬實時，所謂軟實時，就是對任務執(zhí)行時限的要求不那么嚴苛，即使在一些情況下不能滿足時限要求，也不會對系統(tǒng)本身產(chǎn)生致命影響，例如，媒體播放系統(tǒng)就是軟實時的，它需要系統(tǒng)能夠在1秒鐘播放24幀，但是即使在一些嚴重負載的情況下不能在1秒鐘內(nèi)處理24幀，也是可以接受的。所謂硬實時，就是對任務的執(zhí)行時限的要求非常嚴格，無論在什么情況下，任務的執(zhí)行實現(xiàn)必須得到絕對保證，否則將產(chǎn)生災難性后果，例如，飛行器自動駕駛和導航系統(tǒng)就是硬實時的，它必須要求系統(tǒng)能在限定的時限內(nèi)完成特定的任務，否則將導致重大事故，如碰撞或爆炸等。

二、衡量實時性的指標

那么，如何判斷一個系統(tǒng)是否是實時的呢?主要有以下兩個指標：

1. 中斷延遲

中斷延遲就是從一個外部事件發(fā)生到相應的中斷處理函數(shù)的第一條指令開始執(zhí)行所需要的時間。很多實時任務是靠中斷驅(qū)動的，而且中斷事件必須在限定的時限內(nèi)處理，否則將產(chǎn)生災難性后果，因此中斷延遲對于實時系統(tǒng)來說，是一個非常重要的指標。

2. 搶占延遲

有時也稱調(diào)度延遲，搶占延遲就是從一個外部事件發(fā)生到相應的處理該事件的任務的第一條命令開始執(zhí)行的時間。大多數(shù)實時系統(tǒng)都是處理一些周期性的或非周期性的重復事件，事件產(chǎn)生的頻度就確定了任務的執(zhí)行時限，因此每次事件發(fā)生時，相應的處理任務必須及時響應處理，否則將無法滿足時限。搶占延遲就反映了系統(tǒng)的響應及時程度。

如果以上兩個指標是確定的，可預測的，那么就可以說系統(tǒng)是實時的。

三、影響系統(tǒng)實時性的因素

對系統(tǒng)實時性的影響因素既有硬件方面的，也有軟件方面的。

現(xiàn)代的高性能的硬件都使用了cache技術來彌補CPU和內(nèi)存間的性能差距，但是cache卻嚴重地影響著實時性，指令或數(shù)據(jù)在cache中的執(zhí)行時間和指令或數(shù)據(jù)不在cache中的執(zhí)行時間差距是非常巨大的，可能差幾個數(shù)量級，因此為了保證執(zhí)行時間的確定性和可預測性，來滿足實時需要，一些系統(tǒng)就失效了cache或使用沒有cache的CPU。

另一個硬件方面的影響因素就是虛存管理，對于多用戶多任務的操作系統(tǒng)，它確實非常有用，它使得系統(tǒng)能夠執(zhí)行比物理內(nèi)存更大的任務，而且各任務互不影響，完全有自己的獨立的地址空間。但是虛存管理的缺頁機制嚴重地影響了任務執(zhí)行時間的可預測性和確定性，任務執(zhí)行時使用缺頁機制調(diào)入訪問的指令或數(shù)據(jù)和被執(zhí)行的指令和數(shù)據(jù)已經(jīng)在內(nèi)存中需要的執(zhí)行時間的差距是非常大的。因此一些實時系統(tǒng)就不使用虛存技術，例如 Wind River的VxWorks。

在軟件方面，影響因素包括關中斷、不可搶占、一些O(n)的算法。

前面已經(jīng)提到，中斷延遲是衡量系統(tǒng)實時性的一個重要指標。關中斷就導致了中斷無法被響應，增加了中斷延遲。

前面提到的搶占延遲也是衡量系統(tǒng)實時性的重要指標。如果發(fā)生實時事件時系統(tǒng)是不可搶占的，搶占延遲就會增加。

四、嵌入式系統(tǒng)需要實時Linux

Linux在設計之初沒有對實時性進行任何考慮，因此非實時性絕非偶然。Linus考慮的是資源共享，吞吐率最大化。但是隨著Linux的快速發(fā)展，它的應用已經(jīng)遠遠超出了Linus自己的想象。Linux的開放性已經(jīng)對很多種架構(gòu)的支持使得它在嵌入式系統(tǒng)中得到了廣泛的應用，但是許多嵌入式系統(tǒng)的實時性要求使得Linux在嵌入式領域的應用受到了一定的障礙，因此人們要求Linux需要實時性的呼聲越來越高。

Linux的開放性和低成本是實時Linux發(fā)展的優(yōu)勢，越來越多的研究機構(gòu)和商業(yè)團體開展了實時Linux的研究與開發(fā)，其中最著名的就是FSMLab的Rtlinux和TimeSys Linux。還有一個就是Ingo's RT patch。

五、標準Linux內(nèi)核制約實時性的因素

標準Linux有幾個機制嚴重地影響了實時性。

1.內(nèi)核不可搶占

在Linux 2.4和以前的版本，內(nèi)核是不可搶占的，也就是說，如果當前任務運行在內(nèi)核態(tài)，即使當前有更緊急的任務需要運行，當前任務也不能被搶占。因此那個緊急任務必須等到當前任務執(zhí)行完內(nèi)核態(tài)的操作返回用戶態(tài)后或當前任務因需要等待某些條件滿足而主動讓出CPU才能被考慮執(zhí)行，這很明顯嚴重影響搶占延遲。

在Linux 2.6中，內(nèi)核已經(jīng)可以搶占，因而實時性得到了加強。但是內(nèi)核中仍有大量的不可搶占區(qū)域，如由自旋鎖 (spinlock)保護的臨界區(qū)，以及一些顯式使用preempt_disable失效搶占的臨界區(qū)。

2.中斷關閉

Linux在一些同步操作中使用了中斷關閉指令，中斷關閉將增大中斷延遲，降低系統(tǒng)的實時性。

3.自旋鎖(spinlock)

自旋鎖是在可搶占內(nèi)核和SMP情況下對共享資源的一種同步機制，一般地一個任務對共享資源的訪問是非常短暫的，如果兩個任務競爭一個共享的資源時，沒有得到資源的任務將自旋以等待另一個任務使用完該共享資源。這種鎖機制是非常高效的，但是在保持自旋鎖期間將失效搶占，這意味著搶占延遲將增加。在內(nèi)核中，自旋鎖的使用非常普遍，有的甚至對整個一個數(shù)組或鏈表的遍歷過程都使用自旋鎖。因此搶占延遲非常不確定。

4.中斷總是最高優(yōu)先級的

在Linux中，中斷(包括軟中斷)是最高優(yōu)先級的，不論在任何時刻，只要產(chǎn)生中斷事件，內(nèi)核將立即執(zhí)行相應的中斷處理函數(shù)以及軟中斷，等到所有掛起的中斷和軟中斷處理完畢有才執(zhí)行正常的任務。因此在標準的Linux系統(tǒng)上，實時任務根本不可能得到實時性保證。例如，假設在一個標準Linux系統(tǒng)上運行了一個實時任務(即使用了SCHED_FIFO調(diào)度策略)，但是該系統(tǒng)有非常繁重的網(wǎng)絡負載和I/O負載，那么系統(tǒng)可能一直處在中斷處理狀態(tài)而沒有機會運行任何任務，這樣實時任務將永遠無法運行，搶占延遲將是無窮大。因此，如果這種機制不改，實時Linux將永遠無法實現(xiàn)。

5.調(diào)度算法和調(diào)度點

即使內(nèi)核是可搶占的，也不是在任何地方可以發(fā)生調(diào)度，例如在中斷上下文，一個中斷處理函數(shù)可能喚醒了某一高優(yōu)先級進程，但是該進程并不能立即運行，因為在中斷上下文不能發(fā)生調(diào)度，中斷處理完了之后內(nèi)核還要執(zhí)行掛起的軟中斷，如果之前發(fā)生中斷的時候是在spin_lock臨界區(qū)，還有等待執(zhí)行完臨界區(qū)的代碼，等它們?nèi)刻幚硗曛蟛庞袡C會調(diào)度剛才喚醒的進程。

Ingo Molnar 的實時補丁

一、簡介

Ingo Molnar 的實時補丁是完全開源的，它采用的實時實現(xiàn)技術完全類似于Timesys Linux，而且中斷線程化的代碼是基于TimeSys Linux的中斷線程化代碼的。這些實時實現(xiàn)技術包括：中斷線程化(包括IRQ和softirq)、用Mutex取代spinlock、優(yōu)先級繼承和死鎖檢測、等待隊列優(yōu)先級化等。

該實時實現(xiàn)包含了以前的VP補丁(在內(nèi)核郵件列表這么稱呼，即Voluntary Preemption)，VP補丁由針對2.4內(nèi)核的低延遲補丁(low latency patch)演進而來，它使用兩種方法來實現(xiàn)低延遲：

一種就是鎖分解，即把大循環(huán)中保持的鎖分解為每一輪循環(huán)中都獲得鎖和釋放鎖，典型的代碼結(jié)構(gòu)示例如下：鎖分解前：

spin_lock(&x_lock)； 
for (…) { 
    some operations； 
    … 
} 
spin_unlock(&x_lock)；

鎖分解后：

for (…) { 
    spin_lock(&x_lock)； 
    some operations； 
    … 
    spin_unlock(&x_lock)； 
}

另一種是增加搶占點，即自愿被搶占，下面是一個鼠標驅(qū)動的例子：

未增加搶占點以前在文件driver/char/tty_io.c中的一段代碼：

/* Do the write .. */ 
for (;;) { 
        size_t size = count; 
        if (size > chunk) 
                size = chunk; 
        ret = -EFAULT; 
        if (copy_from_user(tty->write_buf, buf, size)) 
                break; 
        lock_kernel(); 
        ret = write(tty, file, tty->write_buf, size); 
        unlock_kernel(); 
        if (ret <= 0) 
                break; 
        written += ret; 
        buf += ret; 
        count -= ret; 
        if (!count) 
                break; 
        ret = -ERESTARTSYS; 
        if (signal_pending(current)) 
                break; 
}

增加搶占點之后：

        /* Do the write .. */ 
for (;;) { 
        size_t size = count; 
        if (size > chunk) 
                size = chunk; 
        ret = -EFAULT; 
        if (copy_from_user(tty->write_buf, buf, size)) 
                break; 
        lock_kernel(); 
        ret = write(tty, file, tty->write_buf, size); 
        unlock_kernel(); 
        if (ret <= 0) 
                break; 
        written += ret; 
        buf += ret; 
        count -= ret; 
        if (!count) 
                break; 
        ret = -ERESTARTSYS; 
        if (signal_pending(current)) 
                break; 
        cond_resched(); 
}

語句cond_resched()將判斷是否有進程需要搶占當前進程，如果是將立即發(fā)生調(diào)度，這就是增加的強占點。

為了能并入主流內(nèi)核，Ingo Molnar的實時補丁也采用了非常靈活的策略，它支持四種搶占模式：

1.No Forced Preemption (Server)，這種模式等同于沒有使能搶占選項的標準內(nèi)核，主要適用于科學計算等服務器環(huán)境。

2.Voluntary Kernel Preemption (Desktop)，這種模式使能了自愿搶占，但仍然失效搶占內(nèi)核選項，它通過增加搶占點縮減了搶占延遲，因此適用于一些需要較好的響應性的環(huán)境，如桌面環(huán)境，當然這種好的響應性是以犧牲一些吞吐率為代價的。

3.Preemptible Kernel (Low-Latency Desktop)，這種模式既包含了自愿搶占，又使能了可搶占內(nèi)核選項，因此有很好的響應延遲，實際上在一定程度上已經(jīng)達到了軟實時性。它主要適用于桌面和一些嵌入式系統(tǒng)，但是吞吐率比模式2更低。

4.Complete Preemption (Real-Time)，這種模式使能了所有實時功能，因此完全能夠滿足軟實時需求，它適用于延遲要求為100微秒或稍低的實時系統(tǒng)。

實現(xiàn)實時是以犧牲系統(tǒng)的吞吐率為代價的，因此實時性越好，系統(tǒng)吞吐率就越低。

它自2004年10月發(fā)布以來一直更新很頻繁，幾乎每天都有新版本發(fā)布中。

二、中斷線程化

中斷線程化是實現(xiàn)Linux實時性的一個重要步驟，在Linux標準內(nèi)核中，中斷是最高優(yōu)先級的執(zhí)行單元，不管內(nèi)核當時處理什么，只要有中斷事件，系統(tǒng)將立即響應該事件并執(zhí)行相應的中斷處理代碼，除非當時中斷關閉(即使用local_irq_disable失效了IRQ)。因此，如果系統(tǒng)有嚴重的網(wǎng)絡或I/O負載，中斷將非常頻繁，實時任務將很難有機會運行，也就是說，毫無實時性可言。中斷線程化之后，中斷將作為內(nèi)核線程運行而且賦予不同的實時優(yōu)先級，實時任務可以有比中斷線程更高的優(yōu)先級，這樣，實時任務就可以作為最高優(yōu)先級的執(zhí)行單元來運行，即使在嚴重負載下仍有實時性保證。

中斷線程化的另一個重要原因是spinlock被mutex取代。中斷處理代碼中大量地使用了spinlock，當spinlock被mutex取代之后，中斷處理代碼就有可能因為得不到鎖而需要被掛到等待隊列上，但是只有可調(diào)度的進程才可以這么做，如果中斷處理代碼仍然使用原來的spinlock，則spinlock取代mutex的努力將大打折扣，因此為了滿足這一要求，中斷必須被線程化，包括IRQ和softirq。

在Ingo Molnar的實時補丁中，中斷線程化的實現(xiàn)方法是：

對于IRQ，在內(nèi)核初始化階段init(該函數(shù)在內(nèi)核源碼樹的文件init/main.c中定義)調(diào)用init_hardirqs(該函數(shù)在內(nèi)核源碼樹的文件kernel/irq/manage.c中定義)來為每一個IRQ創(chuàng)建一個內(nèi)核線程，IRQ號為0的中斷賦予實時優(yōu)先級49，IRQ號為1的賦予實時優(yōu)先級48，依次類推直到25，因此任何IRQ線程的最低實時優(yōu)先級為25。原來的 do_IRQ 被分解成兩部分，架構(gòu)相關的放在類似于arch/*/kernel/irq.c的文件中，名稱仍然為do_IRQ，而架構(gòu)獨立的部分被放在IRQ子系統(tǒng)的位置kernel/irq/handle.c中，名稱為__do_IRQ。當發(fā)生中斷時，CPU將執(zhí)行do_IRQ來處理相應的中斷，do_IRQ將做了必要的架構(gòu)相關的處理后調(diào)用__do_IRQ。函數(shù)__do_IRQ將判斷該中斷是否已經(jīng)被線程化(如果中斷描述符的狀態(tài)字段不包含SA_NODELAY標志說明中斷被線程化了)，如果是將喚醒相應的處理線程，否則將直接調(diào)用handle_IRQ_event(在IRQ子系統(tǒng)位置的kernel/irq/handle.c文件中)來處理。對于已經(jīng)線程化的情況，中斷處理線程被喚醒并開始運行后，將調(diào)用do_hardirq(在源碼樹的IRQ子系統(tǒng)位置的文件kernel/irq/manage.c中定義)來處理相應的中斷，該函數(shù)將判斷是否有中斷需要被處理(中斷描述符的狀態(tài)標志IRQ_INPROGRESS)，如果有就調(diào)用handle_IRQ_event來處理。handle_IRQ_event將直接調(diào)用相應的中斷處理句柄來完成中斷處理。

如果某個中斷需要被實時處理，它可以用SA_NODELAY標志來聲明自己非線程化，例如：

系統(tǒng)的時鐘中斷就是，因為它被用來維護系統(tǒng)時間以及定時器等，所以不應當被線程化。

static struct irqaction irq0  =  
{ timer_interrupt, SA_INTERRUPT | SA_NODELAY, CPU_MASK_NONE, "timer", NULL, NULL};

這是在靜態(tài)聲明時指定不要線程化，也可以在調(diào)用request_irq時指定，如：

static struct irqaction irq0  =  
{ timer_interrupt, SA_INTERRUPT | SA_NODELAY, CPU_MASK_NONE, "timer", NULL, NULL};

對于softirq，標準Linux內(nèi)核已經(jīng)使用內(nèi)核線程的方式來處理，只是Ingo Molnar的實時補丁做了修改使其易于被搶占，改進了實時性，具體的修改包括：

把ksoftirqd的優(yōu)先級設置為nice值為-10，即它的優(yōu)先級高于普通的用戶態(tài)進程和內(nèi)核態(tài)線程，但它不是實時線程，因此這樣一來softirq對實時性的影響將顯著減小。

在處理軟中斷期間，搶占是使能的，這使得實時性更進一步地增強。

在處理軟中斷的函數(shù)___do_softirq中，每次處理完一個待處理的軟中斷后，都將調(diào)用cond_resched_all()，這顯著地增加了調(diào)度點數(shù)，提高了整個系統(tǒng)的實時性。

增加了兩個函數(shù)_do_softirq和___do_softirq，其中___do_softirq就是原來的__do_softirq，只是增加了調(diào)度點。__do_softirq則是對___do_softirq的包裝，_do_softirq是對do_softirq的替代，但保留do_softirq用于一些特殊需要。

三、spinlock轉(zhuǎn)換成mutex

spinlock是一個高效的共享資源同步機制，在SMP(對稱多處理器Symmetric Multiple Proocessors)的情況下，它用于保護共享資源，如全局的數(shù)據(jù)結(jié)構(gòu)或一個只能獨占的硬件資源。但是spinlock保持期間將使搶占失效，用spinlock保護的區(qū)域稱為臨界區(qū)(Critical Section)，在內(nèi)核中大量地使用了spinlock，有大量的臨界區(qū)存在，因此它們將嚴重地影響著系統(tǒng)的實時性。Ingo Molnar的實時補丁使用mutex來替換spinlock，它的意圖是讓spinlock可搶占，但是可搶占后將產(chǎn)生很多后續(xù)影響。

Spinlock失效搶占的目的是避免死鎖。Spinlock如果可搶占了，一個spinlock的競爭者將可能搶占該spinlock的保持者來運行，但是由于得不到spinlock將自旋在那里，如果競爭者的優(yōu)先級高于保持者的優(yōu)先級，將形成一種死鎖的局面，因為保持者無法得到運行而永遠不能釋放spinlock，而競爭者由于不能得到一個不可能釋放的spinlock而永遠自旋在那里。

由于中斷處理函數(shù)也可以使用spinlock，如果它使用的spinlock已經(jīng)被一個進程保持，中斷處理函數(shù)將無法繼續(xù)進行，從而形成死鎖，這樣的spinlock在使用時應當中斷失效來避免這種死鎖的情況發(fā)生。標準linux內(nèi)核就是這么做的，中斷線程化之后，中斷失效就沒有必要，因為遇到這種狀況后，中斷線程將掛在等待隊列上并放棄CPU讓別的線程或進程來運行。

等待隊列就是解決這種死鎖僵局的方法，在Ingo Molnar的實時補丁中，每個spinlock都有一個等待隊列，該等待隊列是按進程或線程的優(yōu)先級排隊的。如果一個進程或線程競爭的spinlock已經(jīng)被另一個線程保持，它將把自己掛在該spinlock的優(yōu)先級化的等待隊列上，然后發(fā)生調(diào)度把CPU讓給別的進程或線程。

需要特別注意，對于非線程化的中斷，必須使用原來的spinlock，原因前面已經(jīng)講得很清楚。

原來的spinlock結(jié)構(gòu)如下：

typedef struct { 
        volatile unsigned long lock; 
# ifdef CONFIG_DEBUG_SPINLOCK 
        unsigned int magic; 
# endif 
# ifdef CONFIG_PREEMPT 
        unsigned int break_lock; 
# endif 
} spinlock_t;

它非常簡潔，替換成mutex之后，它的結(jié)構(gòu)為：

typedef struct { 
        struct rt_mutex lock; 
        unsigned int break_lock; 
} spinlock_t;

其中struct rt_mutex結(jié)構(gòu)如下：

struct rt_mutex { 
        raw_spinlock_t          wait_lock; 
        struct plist            wait_list; 
        struct task_struct      *owner; 
        int                     owner_prio; 
# ifdef CONFIG_RT_DEADLOCK_DETECT 
        int                     save_state; 
        struct list_head        held_list; 
        unsigned long           acquire_eip; 
        char                    *name, *file; 
        int                     line; 
# endif 
};

類型raw_spinlock_t就是原來的spinlock_t。在結(jié)構(gòu)struct rt_mutex中的wait_list字段就是優(yōu)先級化的等待隊列。

原來的rwlock_t結(jié)構(gòu)如下：

typedef struct { volatile unsigned long lock; # ifdef CONFIG_DEBUG_SPINLOCK unsigned magic; # endif # ifdef CONFIG_PREEMPT unsigned int break_lock; # endif } rwlock_t;

被mutex化的rwlock結(jié)構(gòu)如下：

typedef struct { struct rw_semaphore lock; unsigned int break_lock; } rwlock_t;

其中rw_semaphore結(jié)構(gòu)為：

struct rw_semaphore { struct rt_mutex lock; int read_depth; };

rwlock_t和spinlock_t沒有本質(zhì)的不同，只是rwlock_t只能有一個寫者，但可以有多個讀者，因此使用了字段read_depth，其他都等同于spinlock_t。

如果必須使用原來的spinlock，可以把它聲明為raw_spinlock_t，如果必須使用原來的rwlock_t，可以把它聲明為raw_rwlock_t，但是對其進行鎖或解鎖操作時仍然使用同樣的函數(shù)，靜態(tài)初始化時必須分別使用RAW_SPIN_LOCK_UNLOCKED和RAW_RWLOCK_UNLOCKED。為什么不同的變量類型可以使用同樣的函數(shù)操作呢?關鍵在于使用了gcc的內(nèi)嵌函數(shù)__builtin_types_compatible_p，下面以spin_lock為例來說明其中的奧妙：

#define spin_lock(lock) PICK_OP(raw_spinlock_t, spin, _lock, lock)

PICK_OP的定義為：

#define PICK_OP(type, optype, op, lock)                         \ 
do {                                                            \ 
        if (TYPE_EQUAL((lock), type))                           \ 
                _raw_##optype##op((type *)(lock));              \ 
        else if (TYPE_EQUAL(lock, spinlock_t))                  \ 
                _spin##op((spinlock_t *)(lock));                \ 
        else __bad_spinlock_type();                             \ 
} while (0)

TYPE_EQUAL的定義為：

#define TYPE_EQUAL(lock, type) \ 
__builtin_types_compatible_p(typeof(lock), type *)

gcc內(nèi)嵌函數(shù)__builtin_types_compatible_p用于判斷一個變量的類型是否為某指定的類型，如果是就返回1，否則返回0。

因此，如果一個spinlock的類型如果是spinlock_t，宏spin_lock的預處理結(jié)果將是：

do { 
    if (0) 
        _raw_spin_lock((raw_spinlock_t *)(lock)); 
    else if (1) 
        _spin_lock((spinlock_t *)(lock)); 
    else __bad_spinlock_type; 
} while (0)

如果一個spinlock的類型為raw_spinlock_t，宏spin_lock的預處理結(jié)果將是：

do { 
    if (1) 
        _raw_spin_lock((raw_spinlock_t *)(lock)); 
    else if (0) 
        _spin_lock((spinlock_t *)(lock)); 
    else __bad_spinlock_type; 
} while (0)

很明顯，如果類型為spinlock_t，將運行函數(shù)_spin_lock，而如果類型為raw_spinlock_t，將運行函數(shù)_raw_spin_lock。

_spin_lock是新的spinlock的鎖實現(xiàn)函數(shù)，而_raw_spin_lock就是原來的spinlock的鎖實現(xiàn)函數(shù)。

等待隊列優(yōu)先級化的目的是為了更好地改善實時性，因為優(yōu)先級化后，每次當spinlock保持者釋放鎖時總是喚醒排在最前面的優(yōu)先級最高的進程或線程，而喚醒的時間復雜度為O(1)。

四、優(yōu)先級繼承和死鎖檢測

spinlock被mutex化后會產(chǎn)生優(yōu)先級逆轉(zhuǎn)(Priority Inversion)現(xiàn)象。所謂優(yōu)先級逆轉(zhuǎn)，就是優(yōu)先級高的進程由于優(yōu)先級低的進程保持了競爭資源被迫等待，而讓中間優(yōu)先級的進程運行，優(yōu)先級逆轉(zhuǎn)將導致高優(yōu)先級進程的搶占延遲增大，中間優(yōu)先級的進程的執(zhí)行時間的不確定性導致了高優(yōu)先級進程搶占延遲的不確定性，因此為了保證實時性，必須消除優(yōu)先級逆轉(zhuǎn)現(xiàn)象。

優(yōu)先級繼承協(xié)議(Priority Inheritance Protocol)和優(yōu)先級頂棚協(xié)議(Priority Ceiling Protocol)就是專門針對優(yōu)先級逆轉(zhuǎn)問題提出的解決辦法。

所謂優(yōu)先級繼承，就是spinlock的保持者將繼承高優(yōu)先級的競爭者進程的優(yōu)先級，從而能先于中間優(yōu)先級進程運行，盡可能快地釋放鎖，這樣高優(yōu)先級進程就能很快得到競爭的spinlock，使得搶占延遲更確定，更短。

所謂優(yōu)先級頂棚，就是根據(jù)靜態(tài)分析確定一個spinlock的可能擁有者的最高優(yōu)先級，然后把spinlock的優(yōu)先級頂棚設置為該確定的值，每次當進程獲得該spinlock后，就將該進程的優(yōu)先級設置為spinlock的優(yōu)先級頂棚值。

Ingo Molnar的實時補丁實現(xiàn)了優(yōu)先級繼承協(xié)議，但沒有實現(xiàn)優(yōu)先級頂棚協(xié)議。

Spinlock被mutex化后引入的另一個問題就是死鎖，典型的死鎖有兩種：

一種為自鎖，即一個spinlock保持者試圖獲得它已經(jīng)保持的鎖，很顯然，這會導致該進程無法運行而死鎖。

另一種為非順序鎖而導致的，即進程 P1已經(jīng)保持了spinlock LOCKA但是要獲得進程P2已經(jīng)保持的spinlock LOCKB，而進程P2要獲得進程P1已經(jīng)保持的spinlock LOCKA，這樣進程P1和P2都將因為需要得到對方擁有的但永遠不可能釋放的spinlock而死鎖。

Ingo Molnar的實時補丁對這兩種情況進行了檢測，一旦發(fā)生這種死鎖，內(nèi)核將輸出死鎖執(zhí)行路徑并panic。

五、架構(gòu)支持和一些移植以及驅(qū)動注意事項

Ingo Molnar的實時補丁支持的架構(gòu)包括i386、x86_64、ppc和mips，基本上含蓋了主流的架構(gòu)，對于其他的架構(gòu)，移植起來也是非常容易的。

架構(gòu)移植主要涉及到以下幾個方面：

1.中斷線程化

中斷線程化有兩種做法，一種是利用IRQ子系統(tǒng)的代碼，另一種是在架構(gòu)相關的子樹實現(xiàn)，前一種方法利用的是已有的中斷線程化代碼，因此移植時幾乎不需要做什么工作，但是對一些架構(gòu)，這種方法缺乏靈活性，尤其是一些架構(gòu)中斷處理比較特別時，可能會是IRQ子系統(tǒng)的中斷線程化代碼部分變的越來越丑陋，因此對于這種架構(gòu)，后一種方法就有明顯優(yōu)勢，當然在后一種方法中仍然可以拷貝IRQ子系統(tǒng)內(nèi)的大部分線程化處理代碼。

中斷線程化要求一些spinlock或rwlock必須是raw_*類型的，而且一些IRQ必須是非線程化的，如時鐘中斷、級聯(lián)中斷等。這些是中斷線程化的必要前提。

2.一些架構(gòu)相關的代碼

有一些變量定義在架構(gòu)相關的子樹下，如hardirq_preemption等，還有就是需要對entry.S做一些修改，因為增加了一個新的調(diào)用preempt_schedule_irq，它要求在調(diào)用之前失效中斷。還有就是一些調(diào)試代碼支持，那是完全架構(gòu)相關的必須重新實現(xiàn)，如mcount。

3.架構(gòu)相關的semaphore定義必須在第四種搶占模式下失效

前面已經(jīng)講過，如果使能第四種搶占模式，將使用新定義的semaphore，它是架構(gòu)無關的，相應的處理代碼也是架構(gòu)無關的，因此原來的架構(gòu)相關的定義和處理代碼必須失效，這需要修改相應的.h、.c和Makefile。

4.一些spinlock必須聲明為raw_*類型的

在架構(gòu)相關的子樹中，一些spinlock必須聲明為raw_*類型的，靜態(tài)初始化也必須修改為RAW_*，一些外部聲名也得做相應的改動。

5.在打開第四種搶占模式或中斷線程化使能之后，一些編程邏輯要求已經(jīng)發(fā)生了變化。

中斷線程化后，在中斷處理函數(shù)中失效中斷不在需要，因為如果中斷處理線程在中斷失效后想得到spinlock時，將可能發(fā)生上下文切換，新的實時實現(xiàn)認為這種狀況不應當發(fā)生將輸出警告信息。

原來用中斷失效保護共享資源，現(xiàn)在完全可以用搶占失效來替代，因此不是萬不得已，建議不使用中斷失效。在網(wǎng)卡驅(qū)動的發(fā)送處理函數(shù)中不能失效中斷，因此原來顯式得失效中斷的函數(shù)應當被替換，如：

local_irq_save應當變成為local_irq_save_nort 
local_irq_restore應當變成為local_irq_restore_nort

網(wǎng)絡的核心代碼將主動檢測這種情況，如果中斷失效了，將重新打開中斷，但是將輸出警告信息。

在保持了raw_spinlock之后不能在試圖獲得新的spinlock類型的鎖，因為raw_spinlock是搶占失效的，但是新的spinlock卻能夠?qū)е逻M程睡眠或發(fā)生搶占。

對于新的semaphore，必須要求執(zhí)行down和up操作的是同一個進程，否則優(yōu)先級繼承和死鎖檢測將無法實現(xiàn)。而且代碼本身也將操作失敗。

文章參考來源:

https://www.ibm.com/developerworks/cn/linux/l-lrt/part2/

責任編輯：武曉燕來源：相遇Linux

Linux 合并補丁

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<sup id="i054k"><rt id="i054k"></rt></sup><sub id="i054k"><p id="i054k"><form id="i054k"></form></p></sub>

<pre id="i054k"></pre>

<thead id="i054k"><span id="i054k"><label id="i054k"></label></span></thead>