偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

一文看懂內(nèi)存交換機(jī)制

存儲(chǔ) 存儲(chǔ)軟件
由于計(jì)算機(jī)的物理內(nèi)存是有限的, 而進(jìn)程對(duì)內(nèi)存的使用是不確定的, 所以物理內(nèi)存總有用完的可能性. 那么當(dāng)系統(tǒng)的物理內(nèi)存不足時(shí), Linux內(nèi)核使用什么方案來(lái)避免申請(qǐng)不到物理內(nèi)存這個(gè)問(wèn)題呢?

[[420325]]

本文基于 Linux-2.4.16 內(nèi)核版本

由于計(jì)算機(jī)的物理內(nèi)存是有限的, 而進(jìn)程對(duì)內(nèi)存的使用是不確定的, 所以物理內(nèi)存總有用完的可能性. 那么當(dāng)系統(tǒng)的物理內(nèi)存不足時(shí), Linux內(nèi)核使用什么方案來(lái)避免申請(qǐng)不到物理內(nèi)存這個(gè)問(wèn)題呢?

相對(duì)于內(nèi)存來(lái)說(shuō), 磁盤的容量是非常大的, 所以Linux內(nèi)核實(shí)現(xiàn)了一個(gè)叫 內(nèi)存交換 的功能 -- 把某些進(jìn)程的一些暫時(shí)用不到的內(nèi)存頁(yè)保存到磁盤中, 然后把物理內(nèi)存頁(yè)分配給更緊急的用戶使用, 當(dāng)進(jìn)程用到時(shí)再?gòu)拇疟P讀回到內(nèi)存中即可. 有了 內(nèi)存交換 功能, 系統(tǒng)可使用的內(nèi)存就可以遠(yuǎn)遠(yuǎn)大于物理內(nèi)存的容量。

LRU算法

內(nèi)存交換 過(guò)程首先是找到一個(gè)合適的用戶進(jìn)程內(nèi)存管理結(jié)構(gòu),然后把進(jìn)程占用的內(nèi)存頁(yè)交換到磁盤中,并斷開虛擬內(nèi)存與物理內(nèi)存的映射,最后釋放進(jìn)程占用的內(nèi)存頁(yè)。由于涉及到IO操作,所以這是一個(gè)比較耗時(shí)的過(guò)程。如果被交換出去的內(nèi)存頁(yè)剛好又被訪問(wèn)了,這時(shí)又需要從磁盤中把內(nèi)存頁(yè)的數(shù)據(jù)交換到內(nèi)存中。所以,在這種情況下不單不能解決內(nèi)存緊缺的問(wèn)題,而且增加了系統(tǒng)的負(fù)荷。

為了解決這個(gè)問(wèn)題,Linux內(nèi)核使用了一種稱為 LRU (Least Recently Used) 的算法, 下面介紹一下 LRU算法 的大體過(guò)程。

LRU 的中文翻譯是 最近最少使用, 顧名思義就是一段時(shí)間內(nèi)沒(méi)有被使用, 那么Linux內(nèi)核怎么知道哪些內(nèi)存頁(yè)面最近沒(méi)有被使用呢? 最簡(jiǎn)單的方法就是把內(nèi)存頁(yè)放進(jìn)一個(gè)隊(duì)列里, 如果內(nèi)存頁(yè)被訪問(wèn)了, 就把內(nèi)存頁(yè)移動(dòng)到鏈表的頭部, 這樣沒(méi)被訪問(wèn)的內(nèi)存頁(yè)在一段時(shí)間后便會(huì)移動(dòng)到隊(duì)列的尾部, 而釋放內(nèi)存頁(yè)時(shí)從鏈表的尾部開始. 著名的緩存服務(wù)器 memcached 就是使用這種 LRU算法。

Linux內(nèi)核也使用了類似的算法, 但相對(duì)要復(fù)雜一些. Linux內(nèi)核維護(hù)著三個(gè)隊(duì)列: 活躍隊(duì)列, 非活躍臟隊(duì)列和非活躍干凈隊(duì)列. 為什么Linux需要維護(hù)三個(gè)隊(duì)列, 而不是使用一個(gè)隊(duì)列呢? 這是因?yàn)長(zhǎng)inux希望內(nèi)存頁(yè)交換過(guò)程慢慢進(jìn)行, Linux內(nèi)核有個(gè)內(nèi)核線程 kswapd 會(huì)定時(shí)檢查系統(tǒng)的空閑內(nèi)存頁(yè)是否緊缺, 如果系統(tǒng)的空閑內(nèi)存頁(yè)緊缺時(shí)時(shí), 就會(huì)選擇一些用戶進(jìn)程把其占用的內(nèi)存頁(yè)添加到活躍鏈表中并斷開進(jìn)程與此內(nèi)存頁(yè)的映射關(guān)系. 隨著時(shí)間的推移, 如果內(nèi)存頁(yè)沒(méi)有被訪問(wèn), 那么就會(huì)被移動(dòng)到非活躍臟鏈表. 非活躍臟鏈表中的內(nèi)存頁(yè)是需要被交換到磁盤的, 當(dāng)系統(tǒng)中空閑內(nèi)存頁(yè)緊缺時(shí)就會(huì)從非活躍臟鏈表的尾部開始把內(nèi)存頁(yè)刷新到磁盤中, 然后移動(dòng)到非活躍干凈鏈表中, 非活躍干凈鏈表中的內(nèi)存頁(yè)是可以立刻分配給進(jìn)程使用的. 各個(gè)鏈表之間的移動(dòng)如下圖:

lru links

如果在這個(gè)過(guò)程中, 內(nèi)存頁(yè)又被訪問(wèn)了, 那么Linux內(nèi)核會(huì)把內(nèi)存頁(yè)移動(dòng)到活躍鏈表中, 并且建立內(nèi)存映射關(guān)系, 這樣就不需要從磁盤中讀取內(nèi)存頁(yè)的內(nèi)容。

注意: 內(nèi)核只維護(hù)著一個(gè)活躍鏈表和一個(gè)非活躍臟鏈表, 但是非活躍干凈鏈表是每個(gè)內(nèi)存管理區(qū)都有一個(gè)的。

這是因?yàn)榉峙鋬?nèi)存是在內(nèi)存管理區(qū)的基礎(chǔ)上進(jìn)行的, 所以一個(gè)內(nèi)存頁(yè)必須屬于某一個(gè)內(nèi)存管理區(qū)。

kswapd內(nèi)核線程

在Linux系統(tǒng)啟動(dòng)時(shí)會(huì)調(diào)用 kswapd_init() 函數(shù), 代碼如下:

  1. static int __init kswapd_init(void) 
  2.     printk("Starting kswapd v1.8\n"); 
  3.     swap_setup(); 
  4.     kernel_thread(kswapd, NULL, CLONE_FS | CLONE_FILES | CLONE_SIGNAL); 
  5.     kernel_thread(kreclaimd, NULL, CLONE_FS | CLONE_FILES | CLONE_SIGNAL); 
  6.     return 0; 

可以看到, kswapd_init() 函數(shù)會(huì)創(chuàng)建 kswapd 和 kreclaimd 兩個(gè)內(nèi)核線程, 這兩個(gè)內(nèi)核線程負(fù)責(zé)在系統(tǒng)物理內(nèi)存緊缺時(shí)釋放一些物理內(nèi)存頁(yè), 從而使系統(tǒng)的可用內(nèi)存達(dá)到一個(gè)平衡. 下面我們重點(diǎn)來(lái)分析 kswapd 這個(gè)內(nèi)核線程, kswapd() 的源碼如下:

  1. int kswapd(void *unused) 
  2.     struct task_struct *tsk = current
  3.  
  4.     tsk->session = 1; 
  5.     tsk->pgrp = 1; 
  6.     strcpy(tsk->comm, "kswapd"); 
  7.     sigfillset(&tsk->blocked); 
  8.     kswapd_task = tsk; 
  9.  
  10.     tsk->flags |= PF_MEMALLOC; 
  11.  
  12.     for (;;) { 
  13.         static int recalc = 0; 
  14.  
  15.         if (inactive_shortage() || free_shortage()) { 
  16.             int wait = 0; 
  17.             /* Do we need to do some synchronous flushing? */ 
  18.             if (waitqueue_active(&kswapd_done)) 
  19.                 wait = 1; 
  20.             do_try_to_free_pages(GFP_KSWAPD, wait); 
  21.         } 
  22.  
  23.         refill_inactive_scan(6, 0); 
  24.  
  25.         if (time_after(jiffies, recalc + HZ)) { 
  26.             recalc = jiffies; 
  27.             recalculate_vm_stats(); 
  28.         } 
  29.  
  30.         wake_up_all(&kswapd_done); 
  31.         run_task_queue(&tq_disk); 
  32.  
  33.         if (!free_shortage() || !inactive_shortage()) { 
  34.             interruptible_sleep_on_timeout(&kswapd_wait, HZ); 
  35.         } else if (out_of_memory()) { 
  36.             oom_kill(); 
  37.         } 
  38.     } 

kswapd 內(nèi)核線程由一個(gè)無(wú)限循環(huán)組成, 首先通過(guò) inactive_shortage() 和 free_shortage() 函數(shù)判斷系統(tǒng)的非活躍頁(yè)面和空閑物理內(nèi)存頁(yè)是否短缺, 如果短缺的話, 那么就調(diào)用 do_try_to_free_pages() 函數(shù)試圖釋放一些物理內(nèi)存頁(yè). 然后通過(guò)調(diào)用 refill_inactive_scan() 函數(shù)把一些活躍鏈表中的內(nèi)存頁(yè)移動(dòng)到非活躍臟鏈表中. 最后, 如果空閑物理內(nèi)存頁(yè)或者非活躍內(nèi)存頁(yè)不短缺, 那么就讓 kswapd 內(nèi)核線程休眠一秒。

接下來(lái)我們分析一下 do_try_to_free_pages() 函數(shù)做了一些什么工作, 代碼如下:

  1. static int do_try_to_free_pages(unsigned int gfp_mask, int user
  2.     int ret = 0; 
  3.  
  4.     if (free_shortage() || nr_inactive_dirty_pages > nr_free_pages() + nr_inactive_clean_pages()) 
  5.         ret += page_launder(gfp_mask, user); 
  6.  
  7.     if (free_shortage() || inactive_shortage()) { 
  8.         shrink_dcache_memory(6, gfp_mask); 
  9.         shrink_icache_memory(6, gfp_mask); 
  10.         ret += refill_inactive(gfp_mask, user); 
  11.     } else { 
  12.         kmem_cache_reap(gfp_mask); 
  13.         ret = 1; 
  14.     } 
  15.  
  16.     return ret; 

do_try_to_free_pages() 函數(shù)第一步先判斷系統(tǒng)中的空閑物理內(nèi)存頁(yè)是否短缺, 或者非活躍臟頁(yè)面的數(shù)量大于空閑物理內(nèi)存頁(yè)和非活躍干凈頁(yè)面的總和, 其中一個(gè)條件滿足了, 就調(diào)用 page_launder() 函數(shù)把非活躍臟鏈表中的頁(yè)面刷到磁盤中, 然后移動(dòng)到非活躍干凈鏈表中. 接下來(lái)如果內(nèi)存還是緊缺的話, 那么就調(diào)用 shrink_dcache_memory(), shrink_icache_memory() 和 refill_inactive() 函數(shù)繼續(xù)釋放內(nèi)存。

下面我們先來(lái)分析一下 page_launder() 這個(gè)函數(shù), 由于這個(gè)函數(shù)很長(zhǎng), 所以我們分段來(lái)解釋:

  1. int page_launder(int gfp_mask, int sync) 
  2.     int launder_loop, maxscan, cleaned_pages, maxlaunder; 
  3.     int can_get_io_locks; 
  4.     struct list_head * page_lru; 
  5.     struct page * page; 
  6.  
  7.     can_get_io_locks = gfp_mask & __GFP_IO; // 是否需要進(jìn)行寫盤操作 
  8.  
  9.     launder_loop = 0; 
  10.     maxlaunder = 0; 
  11.     cleaned_pages = 0; 
  12.  
  13. dirty_page_rescan: 
  14.     spin_lock(&pagemap_lru_lock); 
  15.     maxscan = nr_inactive_dirty_pages; 
  16.     // 從非活躍臟鏈表的后面開始掃描 
  17.     while ((page_lru = inactive_dirty_list.prev) != &inactive_dirty_list && 
  18.                 maxscan-- > 0) { 
  19.         page = list_entry(page_lru, struct page, lru); 
  20.     ... 

上面的代碼首先把 pagemap_lru_lock 上鎖, 然后從尾部開始遍歷非活躍臟鏈表。

  1. // 如果滿足以下的任意一個(gè)條件, 都表示內(nèi)存頁(yè)在使用中, 把他移動(dòng)到活躍鏈表 
  2. if (PageTestandClearReferenced(page) ||             // 如果設(shè)置了 PG_referenced 標(biāo)志 
  3.         page->age > 0 ||                            // 如果age大于0, 表示頁(yè)面被訪問(wèn)過(guò) 
  4.         (!page->buffers && page_count(page) > 1) || // 如果頁(yè)面被其他進(jìn)程映射 
  5.         page_ramdisk(page)) {                       // 如果用于內(nèi)存磁盤的頁(yè)面 
  6.     del_page_from_inactive_dirty_list(page); 
  7.     add_page_to_active_list(page); 
  8.     continue

上面代碼判斷內(nèi)存頁(yè)是否能需要重新移動(dòng)到活躍鏈表中, 依據(jù)有:

  • 內(nèi)存頁(yè)是否設(shè)置了 PG_referenced 標(biāo)志;
  • 內(nèi)存頁(yè)的age字段是否大于0 (age字段是內(nèi)存頁(yè)的生命周期);
  • 內(nèi)存頁(yè)是否還有映射關(guān)系;
  • 內(nèi)存頁(yè)是否用于內(nèi)存磁盤.

如果滿足上面其中一個(gè)條件, 都需要重新把內(nèi)存頁(yè)移動(dòng)到活躍頁(yè)面中。

  1. if (PageDirty(page)) { // 如果頁(yè)面是臟的, 那么應(yīng)該把頁(yè)面寫到磁盤中 
  2.       int (*writepage)(struct page *) = page->mapping->a_ops->writepage; 
  3.       int result; 
  4.  
  5.       if (!writepage) 
  6.           goto page_active; 
  7.  
  8.       /* First time through? Move it to the back of the list */ 
  9.       if (!launder_loop) { // 第一次只把頁(yè)面移動(dòng)到鏈表的頭部, 這是為了先處理已經(jīng)干凈的頁(yè)面 
  10.           list_del(page_lru); 
  11.           list_add(page_lru, &inactive_dirty_list); 
  12.           UnlockPage(page); 
  13.           continue
  14.       } 
  15.  
  16.       /* OK, do a physical asynchronous write to swap.  */ 
  17.       ClearPageDirty(page); 
  18.       page_cache_get(page); 
  19.       spin_unlock(&pagemap_lru_lock); 
  20.  
  21.       result = writepage(page); 
  22.       page_cache_release(page); 
  23.  
  24.       /* And re-start the thing.. */ 
  25.       spin_lock(&pagemap_lru_lock); 
  26.       if (result != 1) 
  27.           continue
  28.       /* writepage refused to do anything */ 
  29.       set_page_dirty(page); 
  30.       goto page_active; 
  31.   } 

上面的代碼首先判斷內(nèi)存頁(yè)是否臟的(是否設(shè)置了 PG_dirty 標(biāo)志), 如果是, 那么就需要把內(nèi)存頁(yè)刷新到磁盤中. 這里有個(gè)要主要的地方是, 當(dāng) launder_loop 變量為0時(shí)只是把內(nèi)存頁(yè)移動(dòng)到非活躍臟鏈表的頭部. 當(dāng) launder_loop 變量為1時(shí)才會(huì)把內(nèi)存頁(yè)刷新到磁盤中. 為什么要這樣做呢? 這是因?yàn)長(zhǎng)inux內(nèi)核希望第一次掃描先把非活躍臟鏈表中的干凈內(nèi)存頁(yè)移動(dòng)到非活躍干凈鏈表中, 第二次掃描才把臟的內(nèi)存頁(yè)刷新到磁盤中. 后面的代碼會(huì)對(duì) launder_loop 變量進(jìn)行修改. 而且我們發(fā)現(xiàn), 把臟頁(yè)面刷新到磁盤后, 并沒(méi)有立刻把內(nèi)存頁(yè)移動(dòng)到非活躍干凈鏈表中, 而是簡(jiǎn)單的清除了 PG_dirty 標(biāo)志。

  1.         if (page->buffers) { // 涉及文件系統(tǒng)部分, 先略過(guò) 
  2.             ... 
  3.         } else if (page->mapping && !PageDirty(page)) { // 內(nèi)存頁(yè)是干凈的, 移動(dòng)到非活躍干凈鏈表 
  4.             del_page_from_inactive_dirty_list(page); 
  5.             add_page_to_inactive_clean_list(page); 
  6.             UnlockPage(page); 
  7.             cleaned_pages++; 
  8.         } else { 
  9. page_active: 
  10.             del_page_from_inactive_dirty_list(page); 
  11.             add_page_to_active_list(page); 
  12.             UnlockPage(page); 
  13.         } 

上面的代碼比較簡(jiǎn)單, 如果內(nèi)存頁(yè)已經(jīng)是干凈的, 那么久移動(dòng)到非活躍干凈鏈表中.

  1. if (can_get_io_locks && !launder_loop && free_shortage()) { 
  2.     launder_loop = 1; 
  3.     /* If we cleaned pages, never do synchronous IO. */ 
  4.     if (cleaned_pages) 
  5.         sync = 0; 
  6.     /* We only do a few "out of order" flushes. */ 
  7.     maxlaunder = MAX_LAUNDER; 
  8.     /* Kflushd takes care of the rest. */ 
  9.     wakeup_bdflush(0); 
  10.     goto dirty_page_rescan; 
  11.  
  12. /* Return the number of pages moved to the inactive_clean list. */ 
  13. return cleaned_pages; 

從上面的代碼可以看到, 當(dāng) can_get_io_locks 等于1(gfp_mask 設(shè)置了 __GFP_IO 標(biāo)志), launder_loop 等于0, 并且空閑內(nèi)存頁(yè)還是短缺(free_shortage() 為真)的情況下, 把 launder_loop 變量被設(shè)置為1, 并且跳轉(zhuǎn)到 dirty_page_rescan 處重新掃描, 這是第二次掃描非活躍臟鏈表, 會(huì)把臟的內(nèi)存頁(yè)刷新到磁盤中。

接下來(lái)我們繼續(xù)分析 refill_inactive() 這個(gè)函數(shù):

  1. static int refill_inactive(unsigned int gfp_mask, int user
  2.     int priority, count, start_count, made_progress; 
  3.  
  4.     count = inactive_shortage() + free_shortage(); 
  5.     if (user
  6.         count = (1 << page_cluster); 
  7.     start_count = count
  8.  
  9.     ... 
  10.  
  11.     priority = 6; 
  12.     do { 
  13.         made_progress = 0; 
  14.  
  15.         if (current->need_resched) { 
  16.             __set_current_state(TASK_RUNNING); 
  17.             schedule(); 
  18.         } 
  19.  
  20.         while (refill_inactive_scan(priority, 1)) { // 把活躍頁(yè)面鏈表中的頁(yè)面移動(dòng)到非活躍臟頁(yè)面鏈表中 
  21.             made_progress = 1; 
  22.             if (--count <= 0) 
  23.                 goto done; 
  24.         } 
  25.  
  26.         ... 
  27.  
  28.         while (swap_out(priority, gfp_mask)) { // 把一些用戶進(jìn)程映射的內(nèi)存頁(yè)放置到活躍頁(yè)面鏈表中 
  29.             made_progress = 1; 
  30.             if (--count <= 0) 
  31.                 goto done; 
  32.         } 
  33.  
  34.         if (!inactive_shortage() || !free_shortage()) 
  35.             goto done; 
  36.  
  37.         if (!made_progress) 
  38.             priority--; 
  39.     } while (priority >= 0); 
  40.  
  41.     while (refill_inactive_scan(0, 1)) { 
  42.         if (--count <= 0) 
  43.             goto done; 
  44.     } 
  45.  
  46. done: 
  47.     return (count < start_count); 

在這個(gè)函數(shù)中, 我們主要關(guān)注兩個(gè)地方:

  • 調(diào)用 refill_inactive_scan() 函數(shù), refill_inactive_scan() 函數(shù)的作用是把活躍鏈表中的內(nèi)存頁(yè)移動(dòng)到非活躍臟鏈表中。
  • 調(diào)用 swap_out() 函數(shù), swap_out() 函數(shù)的作用是選擇一個(gè)用戶進(jìn)程, 并且把其映射的內(nèi)存頁(yè)添加到活躍鏈表中。

先來(lái)看看 refill_inactive_scan() 函數(shù):

  1. int refill_inactive_scan(unsigned int priority, int oneshot) 
  2.     struct list_head * page_lru; 
  3.     struct page * page; 
  4.     int maxscan, page_active = 0; 
  5.     int ret = 0; 
  6.  
  7.     spin_lock(&pagemap_lru_lock); 
  8.     maxscan = nr_active_pages >> priority; 
  9.     while (maxscan-- > 0 && (page_lru = active_list.prev) != &active_list) { 
  10.         page = list_entry(page_lru, struct page, lru); 
  11.  
  12.         ... 
  13.  
  14.         /* Do aging on the pages. */ 
  15.         if (PageTestandClearReferenced(page)) { 
  16.             age_page_up_nolock(page); 
  17.             page_active = 1; 
  18.         } else { 
  19.             age_page_down_ageonly(page); // page->age = page->age / 2 
  20.  
  21.             if (page->age == 0 && page_count(page) <= (page->buffers ? 2 : 1)) { 
  22.                 deactivate_page_nolock(page); // 把頁(yè)面放置到非活躍臟頁(yè)面鏈表 
  23.                 page_active = 0; 
  24.             } else { 
  25.                 page_active = 1; 
  26.             } 
  27.         } 
  28.  
  29.         if (page_active || PageActive(page)) { 
  30.             list_del(page_lru); 
  31.             list_add(page_lru, &active_list); 
  32.         } else { 
  33.             ret = 1; 
  34.             if (oneshot) 
  35.                 break; 
  36.         } 
  37.     } 
  38.     spin_unlock(&pagemap_lru_lock); 
  39.  
  40.     return ret; 

refill_inactive_scan() 函數(shù)比較簡(jiǎn)單, 首先從活躍鏈表的尾部開始遍歷, 然后判斷內(nèi)存頁(yè)的生命是否已經(jīng)用完(age是否等于0), 并且沒(méi)有進(jìn)程與其有映射關(guān)系(count是否等于1). 如果是, 那么就調(diào)用 deactivate_page_nolock() 函數(shù)把內(nèi)存頁(yè)移動(dòng)到非活躍臟鏈表中。

接著來(lái)看看 swap_out() 函數(shù), swap_out() 函數(shù)比較復(fù)雜, 但最終會(huì)調(diào)用 try_to_swap_out() 函數(shù), 所以我們只分析 try_to_swap_out() 函數(shù):

  1. static int try_to_swap_out(struct mm_struct * mm, struct vm_area_struct* vma, unsigned long address, pte_t * page_table, int gfp_mask) 
  2.     ... 
  3.     page = pte_page(pte); 
  4.  
  5.     if (!mm->swap_cnt) 
  6.         return 1; 
  7.  
  8.     mm->swap_cnt--; 
  9.  
  10.     ... 
  11.  
  12.     if (PageSwapCache(page)) { // 內(nèi)存頁(yè)之前已經(jīng)發(fā)生過(guò)交換操作 
  13.         entry.val = page->index
  14.         if (pte_dirty(pte)) 
  15.             set_page_dirty(page); 
  16. set_swap_pte: 
  17.         swap_duplicate(entry); 
  18.         // 把頁(yè)目錄項(xiàng)設(shè)置為磁盤交換區(qū)的信息(注意:此時(shí)是否在內(nèi)存中標(biāo)志位為0, 所以訪問(wèn)這個(gè)內(nèi)存地址會(huì)觸發(fā)內(nèi)存訪問(wèn)異常) 
  19.         set_pte(page_table, swp_entry_to_pte(entry)); 
  20. drop_pte: 
  21.         UnlockPage(page); 
  22.         mm->rss--; 
  23.         deactivate_page(page); 
  24.         page_cache_release(page); 
  25. out_failed: 
  26.         return 0; 
  27.     } 
  28.  
  29.     ... 
  30.  
  31.     entry = get_swap_page(); 
  32.     if (!entry.val) 
  33.         goto out_unlock_restore; /* No swap space left */ 
  34.  
  35.     add_to_swap_cache(page, entry); 
  36.     set_page_dirty(page); 
  37.     goto set_swap_pte; 
  38.  
  39. out_unlock_restore: 
  40.     set_pte(page_table, pte); 
  41.     UnlockPage(page); 
  42.     return 0; 

上面的代碼中, 首先調(diào)用 get_swap_page() 函數(shù)獲取交換文件的一個(gè)槽(用于保存內(nèi)存頁(yè)的內(nèi)容), 然后調(diào)用 add_to_swap_cache() 函數(shù)把內(nèi)存頁(yè)添加到活躍鏈表中, add_to_swap_cache() 函數(shù)源碼如下:

  1. void add_to_swap_cache(struct page *page, swp_entry_t entry) 
  2.     ... 
  3.     add_to_page_cache_locked(page, &swapper_space, entry.val); 
  4.  
  5. void add_to_page_cache_locked(struct page * page, struct address_space *mapping, unsigned long index
  6.     if (!PageLocked(page)) 
  7.         BUG(); 
  8.  
  9.     page_cache_get(page); 
  10.     spin_lock(&pagecache_lock); 
  11.     page->index = index
  12.     add_page_to_inode_queue(mapping, page); 
  13.     add_page_to_hash_queue(page, page_hash(mapping, index)); 
  14.     lru_cache_add(page); 
  15.     spin_unlock(&pagecache_lock); 

add_to_swap_cache() 函數(shù)會(huì)調(diào)用 add_to_page_cache_locked() 函數(shù), 而add_to_page_cache_locked() 函數(shù)會(huì)調(diào)用 lru_cache_add() 函數(shù)來(lái)把內(nèi)存頁(yè)添加到活躍鏈表中, lru_cache_add() 函數(shù)代碼如下:

  1. #define add_page_to_active_list(page) {     \ 
  2.     DEBUG_ADD_PAGE                          \ 
  3.     ZERO_PAGE_BUG                           \ 
  4.     SetPageActive(page);                    \ 
  5.     list_add(&(page)->lru, &active_list);   \ 
  6.     nr_active_pages++;                      \ 
  7.  
  8. void lru_cache_add(struct page * page) 
  9.     spin_lock(&pagemap_lru_lock); 
  10.     if (!PageLocked(page)) 
  11.         BUG(); 
  12.     DEBUG_ADD_PAGE 
  13.     add_page_to_active_list(page); 
  14.     /* This should be relatively rare */ 
  15.     if (!page->age) 
  16.         deactivate_page_nolock(page); 
  17.     spin_unlock(&pagemap_lru_lock); 

從上面的代碼可以看到, lru_cache_add() 函數(shù)最終會(huì)調(diào)用 list_add(&(page)->lru, &active_list) 這行代碼來(lái)把內(nèi)存頁(yè)添加到活躍鏈表(active_list)中, 并設(shè)置內(nèi)存頁(yè)的 PG_active 標(biāo)志.

最后我們通過(guò)一幅圖來(lái)總結(jié)一下 kswapd 內(nèi)核線程的流程:

  1. kswap() 
  2. └→ do_try_free_pages() 
  3.    └→ page_launder() 
  4.    └→ refill_inactive() 
  5.       └→ refill_inactive_scan() 
  6.       └→ swap_out() 

swap_out() 函數(shù)會(huì)把進(jìn)程占用的內(nèi)存頁(yè)添加到活躍鏈表中, 而 refill_inactive_scan() 函數(shù)會(huì)把活躍鏈表的內(nèi)存頁(yè)移動(dòng)到非活躍臟鏈表中, 最后 page_launder() 會(huì)把非活躍臟鏈表的內(nèi)存頁(yè)刷新到磁盤并且移動(dòng)到非活躍干凈鏈表中, 非活躍干凈鏈表中的內(nèi)存頁(yè)是直接可以用來(lái)分配使用的。

 

責(zé)任編輯:武曉燕 來(lái)源: Linux內(nèi)核那些事
相關(guān)推薦

2021-05-11 10:40:29

JUCAQSJava

2021-05-12 15:16:17

JUCAQSJava

2022-04-26 13:41:16

區(qū)塊鏈比特幣數(shù)據(jù)庫(kù)

2025-06-09 04:00:00

2020-03-31 14:40:24

HashMap源碼Java

2021-06-06 13:06:34

JVM內(nèi)存分布

2016-08-18 00:21:12

網(wǎng)絡(luò)爬蟲抓取網(wǎng)絡(luò)

2024-08-12 12:30:27

2025-01-20 09:15:00

iOS 18.3蘋果iOS 18

2021-08-02 06:56:19

TypeScript編程語(yǔ)言編譯器

2019-07-01 09:22:15

Linux操作系統(tǒng)硬件

2019-05-22 09:50:42

Python沙箱逃逸網(wǎng)絡(luò)攻擊

2019-09-29 06:12:38

交換機(jī)配置vlan

2025-03-25 09:06:11

2021-02-21 11:25:17

云計(jì)算IaaSPaaS

2024-10-10 17:55:57

LinuxACL訪問(wèn)控制列表

2023-04-10 11:35:31

評(píng)估模型業(yè)務(wù)流程

2023-12-18 10:45:31

2022-12-07 07:38:07

存儲(chǔ)管理HSM

2024-12-30 07:30:00

PLC通訊協(xié)議
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)