最短的崩潰程序(C語言版)
想寫個(gè)崩潰的C語言小程序,看起來是個(gè)奇怪的主意,不過在我曾經(jīng)教過的一門實(shí)驗(yàn)課上,這是作業(yè)之一!實(shí)際上,這是一件非常有教學(xué)意義的事情。
通常學(xué)生們要么嘗試反向引用一個(gè)非法地址,要么就是除0.除0會(huì)引發(fā)SIGFPE信號(hào)(浮點(diǎn)異常)。這里有一個(gè)小例子程序,使用除零方法來使之崩潰:
- int main()
- {
- return 1/0;
- }
我們也可以刪掉return關(guān)鍵字,但是當(dāng)我這么做的時(shí)候gcc不會(huì)為這些語句生成可執(zhí)行代碼,即便優(yōu)化選項(xiàng)被disable掉了。我們還可以通過把上面的語句改成賦值語句,使上面的代碼改變一些特征:
- i;
- int main()
- {
- i=1/0;
- }
注意我聲明了一個(gè)沒有類型的i。這樣的代碼在C89標(biāo)準(zhǔn)里是有效的,因?yàn)樗械穆暶鞫加须[形的缺省類型int。在C99和其他一些C標(biāo)準(zhǔn)里這是一個(gè)錯(cuò)誤。假定我們寫的是C89代碼,那么我們甚至可以使用隱形int來聲明main函數(shù):
- i;
- main()
- {
- i=1/0;
- }
那是相當(dāng)短的代碼了 — 如果我們不把用于縮進(jìn)的空格計(jì)算進(jìn)來,只有16個(gè)字符。然而,我們還可以做得更好!
當(dāng)C程序在編譯的時(shí)候,編譯器會(huì)產(chǎn)生一個(gè)或更多對(duì)象文件,文件里有對(duì)于用到的庫(kù)和全程對(duì)象(函數(shù)和變量)的符號(hào)索引。然后這些對(duì)象文件會(huì)被進(jìn)行鏈接,這時(shí)符號(hào)索引被地址所代替,就產(chǎn)生了一個(gè)可執(zhí)行文件。
編譯器在一個(gè)對(duì)象文件里提供了一個(gè)調(diào)用main函數(shù)的入口點(diǎn)。調(diào)用main函數(shù)意味著我們?cè)噲D執(zhí)行在存儲(chǔ)在main函數(shù)鏈接的位置所對(duì)應(yīng)地址里的指令。
有趣的是,鏈接器對(duì)于不同對(duì)象的類型是沒有概念的,它只知道它們的地址。所以,如果我們用一個(gè)常規(guī)的全程變量替換main函數(shù),編譯器會(huì)高興地build對(duì)象文件,因?yàn)樗魂P(guān)心對(duì)象main的類型是什么;鏈接器也會(huì)高興地鏈接它,因?yàn)樗魂P(guān)心main函數(shù)對(duì)應(yīng)的地址。
所以,考慮這個(gè)C程序:
- int main=0;
這個(gè)程序會(huì)編譯成一個(gè)可執(zhí)行文件,它會(huì)試圖調(diào)用地址0,而0并不是我們能夠訪問的地址,這樣我們會(huì)得到SIGSEGV信號(hào)(分段錯(cuò)誤)。
更正:我前面關(guān)于這個(gè)程序崩潰的原因分析是錯(cuò)的。這個(gè)程序會(huì)試圖按函數(shù)方式去執(zhí)行main,而這樣不會(huì)奏效,因?yàn)榫幾g器把它放到了不可執(zhí)行的數(shù)據(jù)段。所以變量main初始化為什么值都無所謂了。(感謝Zack的糾正)
現(xiàn)在我們已經(jīng)非常接近最小的崩潰的C程序了。我們可以利用這個(gè)技巧,配合隱形int類型,來把它進(jìn)一步縮短。
- main=0;
還有,C里的全局變量都會(huì)隱形地初始化為0,所以上面的代碼就等同于:
- main;
好了,現(xiàn)在我們得到了最短的崩潰的C程序!
補(bǔ)充:
Hacker News用戶femto指出,編譯和鏈接一個(gè)空文件也是可能的。我沒有發(fā)布這個(gè)是因?yàn)間cc會(huì)拒絕編譯和鏈接這樣的程序,它會(huì)要求分開編譯和鏈接的過程。
另外,要是我們?cè)賹W(xué)究一點(diǎn),我應(yīng)該指出我這里的“全局”變量意思是說“靜態(tài)”變量。
英文原文:llbit.se