偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Linux內(nèi)核編譯中的九個(gè)技巧

系統(tǒng) Linux
關(guān)于Linux的內(nèi)核編譯有不少系統(tǒng)管理員都不知道如何去處理。其實(shí)就像平時(shí)的Linux系統(tǒng)管理一樣Linux內(nèi)核編譯也有技巧可以掌握。在本文中我們就向大家介紹下Linux內(nèi)核編譯九個(gè)技巧。

關(guān)于Linux的內(nèi)核編譯有不少系統(tǒng)管理員都不知道如何去處理。其實(shí)就像平時(shí)的Linux系統(tǒng)管理一樣Linux內(nèi)核編譯也有技巧可以掌握。在本文中我們就向大家介紹下Linux內(nèi)核編譯九個(gè)技巧。

1構(gòu)建泛型宏 (./linux/include/linux/kernel.h)

#define min(x, y) ({ \ 
typeof(x) _min1 = (x); \
typeof(y) _min2 = (y); \
(void) (&_min1 == &_min2); \
_min1 < _min2 ? _min1 : _min2; })

大家看了就明白是什么意思了。但是我還有幾點(diǎn)疑問:

(1)(void) (&_min1 == &_min2);這行代碼是用來干什么的?

(2)為什么{}的外面要加(),不加的時(shí)候編譯是不通過的,具體是什么原因?

2 范圍的擴(kuò)展

(1) switch 語句

 switch(a)
  {
   case 1 ... 3:
       printf("fafadsf");
       break;
   case 4 ... 8:
       printf("dsafaf");
       break;
   }

(2)數(shù)組的初始化 int widths[] = { [0 ... 9] = 1, [10 ... 99] = 2, [100] = 3 };以上部分內(nèi)核中用的很多。#p#

3 零長度的數(shù)組

struct iso_block_store {
        atomic_t refcount;
        size_t data_size;
        quadlet_t data[0];
};

這允許結(jié)構(gòu)中的元素引用結(jié)構(gòu)實(shí)例后面緊接著的內(nèi)存。在需要數(shù)量可變的數(shù)組成員時(shí),這個(gè)特性很有用應(yīng)用實(shí)例:

struct iso_block_store * p =(void *)malloc(sizeof(struct iso_block_store) + data_size);

4 獲得函數(shù)的返回地址

如下面的代碼所示,__builtin_return_address 接收一個(gè)稱為 level 的參數(shù)。這個(gè)參數(shù)定義希望獲取返回地址的調(diào)用堆棧級別。例如,如果指定 level 為 0,那么就是請求當(dāng)前函數(shù)的返回地址。如果指定 level 為 1,那么就是請求進(jìn)行調(diào)用的函數(shù)的返回地址,依此類推。

void * __builtin_turn_address( unsigned int level );

在下面的示例中(見 ./linux/kernel/softirq.c),local_bh_disable 函數(shù)在本地處理器上禁用軟中斷,從而禁止在當(dāng)前處理器上運(yùn)行 softirqs、tasklets 和 bottom halves。使用 __builtin_return_address 捕捉返回地址,以便在以后進(jìn)行跟蹤時(shí)使用這個(gè)地址。

void local_bh_disable(void){ __local_bh_disable((unsigned long)__builtin_return_address(0));}

#p#

5 常量檢測

在編譯時(shí),可以使用 GCC 提供的一個(gè)內(nèi)置函數(shù)判斷一個(gè)值是否是常量。這種信息非常有價(jià)值,因?yàn)榭梢詷?gòu)造出能夠通過常量疊算(constant folding)優(yōu)化的表達(dá)式。__builtin_constant_p 函數(shù)用來檢測常量。

__builtin_constant_p 的原型如下所示。注意,__builtin_constant_p 并不能檢測出所有常量,因?yàn)?GCC 不容易證明某些值是否是常量。

int __builtin_constant_p( exp )
 

Linux 相當(dāng)頻繁地使用常量檢測。在清單 3 所示的示例中(見 ./linux/include/linux/log2.h),使用常量檢測優(yōu)化 roundup_pow_of_two 宏。如果發(fā)現(xiàn)表達(dá)式是常量,那么就使用可以優(yōu)化的常量表達(dá)式。如果表達(dá)式不是常量,就調(diào)用另一個(gè)宏函數(shù)把值向上取整到 2 的冪。

 

#define roundup_pow_of_two(n) \
( \
__builtin_constant_p(n) ? ( \
(n == 1) ? 1 : \
(1UL << (ilog2((n) - 1) + 1)) \
   ) : \
__roundup_pow_of_two(n) \

6 函數(shù)屬性

GCC 提供許多函數(shù)級屬性,可以通過它們向編譯器提供更多數(shù)據(jù),幫助編譯器執(zhí)行優(yōu)化。本節(jié)描述與功能相關(guān)聯(lián)的一些屬性。

屬性通過其他符號定義指定了別名。

# define __inline__     __inline__      __attribute__((always_inline))
# define __deprecated           __attribute__((deprecated))
# define __attribute_used__     __attribute__((__used__))
# define __attribute_const__     __attribute__((__const__))
# define __must_check            __attribute__((warn_unused_result))

定義是 GCC 中可用的一些函數(shù)屬性。它們也是在 Linux 內(nèi)核中最有用的函數(shù)屬性。下面解釋如何使用這些屬性:

always_inline 讓 GCC 以內(nèi)聯(lián)方式處理指定的函數(shù),無論是否啟用了優(yōu)化。
deprecated 指出函數(shù)已經(jīng)被廢棄,不應(yīng)該再使用。如果試圖使用已經(jīng)廢棄的函數(shù),就會(huì)收到警告。還可以對類型和變量應(yīng)用這個(gè)屬性,促使開發(fā)人員盡可能少使用它們。
__used__ 告訴編譯器無論 GCC 是否發(fā)現(xiàn)這個(gè)函數(shù)的調(diào)用實(shí)例,都要使用這個(gè)函數(shù)。這對于從匯編代碼中調(diào)用 C 函數(shù)有幫助。
__const__ 告訴編譯器某個(gè)函數(shù)是無狀態(tài)的(也就是說,它使用傳遞給它的參數(shù)生成要返回的結(jié)果)。
warn_unused_result 讓編譯器檢查所有調(diào)用者是否都檢查函數(shù)的結(jié)果。這確保調(diào)用者適當(dāng)?shù)貦z驗(yàn)函數(shù)結(jié)果,從而能夠適當(dāng)?shù)靥幚礤e(cuò)誤。
下面是在 Linux 內(nèi)核中使用這些屬性的示例。deprecated 示例來自與體系結(jié)構(gòu)無關(guān)的內(nèi)核(./linux/kernel/resource.c),const 示例來自 IA64 內(nèi)核源代碼(./linux/arch/ia64/kernel/unwind.c)。

int __deprecated __check_region(struct resource 
*parent, unsigned long start, unsigned long n)

static enum unw_register_index __attribute_const__
decode_abreg(unsigned char abreg, int memory)

#p#

7 分支預(yù)測提示

在 Linux 內(nèi)核中最常用的優(yōu)化技術(shù)之一是 __builtin_expect。在開發(fā)人員使用有條件代碼時(shí),常常知道最可能執(zhí)行哪個(gè)分支,而哪個(gè)分支很少執(zhí)行。如果編譯器知道這種預(yù)測信息,就可以圍繞最可能執(zhí)行的分支生成最優(yōu)的代碼。

如下所示,__builtin_expect 的使用方法基于兩個(gè)宏 likely 和 unlikely(見 ./linux/include/linux/compiler.h)。

#define likely(x) __builtin_expect(!!(x), 1)
#define unlikely(x) __builtin_expect(!!(x), 0)

 

通過使用 __builtin_expect,編譯器可以做出符合提供的預(yù)測信息的指令選擇決策。這使執(zhí)行的代碼盡可能接近實(shí)際情況。它還可以改進(jìn)緩存和指令流水線。

例如,如果一個(gè)條件標(biāo)上了 “likely”,那么編譯器可以把代碼的 True 部分直接放在分支指令后面(這樣就不需要執(zhí)行分支指令)。通過分支指令訪問條件結(jié)構(gòu)的 False 部分,這不是最優(yōu)的方式,但是訪問它的可能性不大。按照這種方式,代碼對于最可能出現(xiàn)的情況是最優(yōu)的。

下面給出一個(gè)使用 likely 和 unlikely 宏的函數(shù)(見 ./linux/net/core/datagram.c)。這個(gè)函數(shù)預(yù)測 sum 變量將是零(數(shù)據(jù)包的 checksum 是有效的),而且 ip_summed 變量不等于 CHECKSUM_HW。

unsigned int __skb_checksum_complete(struct sk_buff *skb)
{
        unsigned int sum;

        sum = (u16)csum_fold(skb_checksum(skb, 0, skb->len, skb->csum));
        if (likely(!sum)) {
                if (unlikely(skb->ip_summed == CHECKSUM_HW))
                        netdev_rx_csum_fault(skb->dev);
                skb->ip_summed = CHECKSUM_UNNECESSARY;
        }
        return sum;
}
 

#p#

8 預(yù)抓取

另一種重要的性能改進(jìn)方法是把必需的數(shù)據(jù)緩存在接近處理器的地方。緩存可以顯著減少訪問數(shù)據(jù)花費(fèi)的時(shí)間。大多數(shù)現(xiàn)代處理器都有三類內(nèi)存:

一級緩存通常支持單周期訪問
二級緩存支持兩周期訪問
系統(tǒng)內(nèi)存支持更長的訪問時(shí)間
為了盡可能減少訪問延時(shí)并由此提高性能,最好把數(shù)據(jù)放在最近的內(nèi)存中。手工執(zhí)行這個(gè)任務(wù)稱為預(yù)抓取。GCC 通過內(nèi)置函數(shù) __builtin_prefetch 支持?jǐn)?shù)據(jù)的手工預(yù)抓取。在需要數(shù)據(jù)之前,使用這個(gè)函數(shù)把數(shù)據(jù)放到緩存中。如下所示,__builtin_prefetch 函數(shù)接收三個(gè)參數(shù):

數(shù)據(jù)的地址

rw 參數(shù),使用它指明預(yù)抓取數(shù)據(jù)是為了執(zhí)行讀操作,還是執(zhí)行寫操作
locality 參數(shù),使用它指定在使用數(shù)據(jù)之后數(shù)據(jù)應(yīng)該留在緩存中,還是應(yīng)該清除

void __builtin_prefetch( const void *addr, int rw, int locality );

Linux 內(nèi)核經(jīng)常使用預(yù)抓取。通常是通過宏和包裝器函數(shù)使用預(yù)抓取。下面是一個(gè)輔助函數(shù)示例,它使用內(nèi)置函數(shù)的包裝器(見 ./linux/include/linux/prefetch.h)。這個(gè)函數(shù)為流操作實(shí)現(xiàn)預(yù)抓取機(jī)制。使用這個(gè)函數(shù)通??梢詼p少緩存缺失和停頓,從而提高性能。

#ifndef ARCH_HAS_PREFETCH#define prefetch(x) __builtin_prefetch(x)#endifstatic inline void prefetch_range(void *addr, size_t len){#ifdef ARCH_HAS_PREFETCH char *cp; char *end = addr + len; for (cp = addr; cp < end; cp += PREFETCH_STRIDE) prefetch(cp);#endif}

9變量屬性

除了本文前面討論的函數(shù)屬性之外,GCC 還為變量和類型定義提供了屬性。最重要的屬性之一是 aligned 屬性,它用于在內(nèi)存中實(shí)現(xiàn)對象對齊。除了對于性能很重要之外,某些設(shè)備或硬件配置也需要對象對齊。aligned 屬性有一個(gè)參數(shù),它指定所需的對齊類型。

下面的示例用于軟件暫停(見 ./linux/arch/i386/mm/init.c)。在需要頁面對齊時(shí),定義 PAGE_SIZE 對象。

char __nosavedata swsusp_pg_dir[PAGE_SIZE]
__attribute__ ((aligned (PAGE_SIZE)));
 

packed 屬性打包一個(gè)結(jié)構(gòu)的元素,從而盡可能減少它們占用的空間。這意味著,如果定義一個(gè) char 變量,它占用的空間不會(huì)超過一字節(jié)(8 位)。位字段壓縮為一位,而不會(huì)占用更多存儲(chǔ)空間。
這段源代碼使用一個(gè) __attribute__ 聲明進(jìn)行優(yōu)化,它用逗號分隔的列表定義多個(gè)屬性。

 

static struct swsusp_header {
        char reserved[PAGE_SIZE - 20 - sizeof(swp_entry_t)];
        swp_entry_t image;
        char    orig_sig[10];
        char    sig[10];
} __attribute__((packed, aligned(PAGE_SIZE))) swsusp_header;

【編輯推薦】

  1. Linux內(nèi)核編譯后地址空間的整理
  2. Linux內(nèi)核編譯指南
  3. linux內(nèi)核中的個(gè)性時(shí)鐘nohz與hres
  4. 簡單介紹Linux內(nèi)核安全入侵偵察系統(tǒng)
責(zé)任編輯:張浩 來源: 互聯(lián)網(wǎng)
相關(guān)推薦

2021-05-26 07:53:58

Linux運(yùn)維Linux系統(tǒng)

2023-07-25 15:17:38

Linux操作系統(tǒng)開發(fā)

2023-08-11 17:39:43

JavaScriptWeb 應(yīng)用程序

2009-10-16 09:45:41

Linux內(nèi)核操作系統(tǒng)

2022-02-08 15:15:26

OpenHarmonlinux鴻蒙

2023-07-18 07:56:31

工具reduce業(yè)務(wù)

2023-07-18 10:39:30

技術(shù)領(lǐng)導(dǎo)者CIO

2023-06-28 00:02:40

2017-03-27 18:05:49

Linux內(nèi)核編譯與開發(fā)

2023-05-08 08:05:42

內(nèi)核模塊Linux

2022-09-23 11:44:54

惡意軟件Linux

2023-12-25 11:29:33

IT服務(wù)企業(yè)高效交付

2009-08-07 10:28:03

2021-09-27 13:02:05

Python技巧測試

2023-01-03 15:47:09

Linux內(nèi)核C語言

2009-02-02 09:37:23

2011-01-04 17:00:32

Linux內(nèi)核編譯

2009-12-17 15:18:47

2010-03-02 16:13:56

Linux升級

2023-10-05 15:47:04

Linux內(nèi)核編譯
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號