程序體積優(yōu)化的十個小妙招
本文轉(zhuǎn)載自微信公眾號「程序喵大人」,作者程序喵大人。轉(zhuǎn)載本文請聯(lián)系程序喵大人公眾號。
大家好,我是程序喵,眾所周知,前兩天,小破站又上市了,慷慨的宣布要給員工加雞腿,激動的喵哥一夜沒睡好,萬萬妹想到啊,人算不如天算,公司真的發(fā)了雞腿,沒錯,就是你想的那個。
雞腿啥的不想了,我還是安心肝文章吧。。。
前一段時間在知乎上看到個問題:Linux如何優(yōu)化可執(zhí)行程序的體積?
在我們的日常工作中,一般對程序的體積都有嚴(yán)格的要求,有時候僅僅因為幾字節(jié)的代碼段體積或者多了幾十毫秒的運行時間,整個項目就達(dá)不到驗收標(biāo)準(zhǔn),甚至不能成功上線。這里我拋磚引玉先提出幾個思路,大家如果有好的優(yōu)化策略歡迎打在評論區(qū)。
大體思路有這些:
- 好好寫代碼,減小代碼段體積,別人300代碼的邏輯我們50行搞定,程序體積肯定有機(jī)會更小一些,這個就得考驗開發(fā)者自己的編程功底了
- 如果是C++程序,可以盡量減少模板的使用,模板實例化可能會導(dǎo)致代碼膨脹
- 不用引用沒有用的頭文件
- 使用strip,像脫衣服一樣,移除程序的所有符號,這也是很多開發(fā)者常用的方式
- strip只會清除普通符號,不會動態(tài)符號表中的符號,某些動態(tài)符號其實也可以隱藏掉,進(jìn)而來減小庫的體積,可以使用-fvisibility=hidden命令
- 巧用.bss段,未初始化的全局變量和局部靜態(tài)變量會存在.bss段中,這些變量不占用程序空間
- inline-limit:內(nèi)聯(lián)過多會導(dǎo)致代碼段體積較大,可以通過此優(yōu)化選項減少內(nèi)聯(lián)的數(shù)量
- 開啟Os編譯,這是產(chǎn)生較小代碼體積的優(yōu)化選項
- 適當(dāng)使用編譯選項-fdata-sections和-ffunction-sections
- 考慮鏈接動態(tài)庫而非靜態(tài)庫
以上說的太籠統(tǒng)了?貼心如我早就準(zhǔn)備好了,不謝~
strip使用
在Linux中可以使用man strip查看strip使用方法,最主要的就是移除所有符號的-s參數(shù),用于清除所有的符號信息:
- strip -s xxx
在使用strip之前先使用nm查看下可執(zhí)行程序的符號信息:
- ~/test$ nm a.out
- 0000000000200da0 d _DYNAMIC
- 0000000000200fa0 d _GLOBAL_OFFSET_TABLE_
- 000000000000089b t _GLOBAL__sub_I__Z4funcPc
- 0000000000000930 R _IO_stdin_used
- w _ITM_deregisterTMCloneTable
- w _ITM_registerTMCloneTable
- 0000000000000852 t _Z41__static_initialization_and_destruction_0ii
- 00000000000007fa T _Z4funcPc
- 000000000000081c T _Z4funci
- U _ZNSt8ios_base4InitC1Ev@@GLIBCXX_3.4
- U _ZNSt8ios_base4InitD1Ev@@GLIBCXX_3.4
- 0000000000201020 B _ZSt4cout@@GLIBCXX_3.4
- 0000000000000934 r _ZStL19piecewise_construct
- 0000000000201131 b _ZStL8__ioinit
- U _ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@@GLIBCXX_3.4
- 0000000000000b24 r __FRAME_END__
- 0000000000000940 r __GNU_EH_FRAME_HDR
- 0000000000201010 D __TMC_END__
- 0000000000201010 B __bss_start
- U __cxa_atexit@@GLIBC_2.2.5
- w __cxa_finalize@@GLIBC_2.2.5
- 0000000000201000 D __data_start
- 00000000000007b0 t __do_global_dtors_aux
- 0000000000200d98 t __do_global_dtors_aux_fini_array_entry
- 0000000000201008 D __dso_handle
- 0000000000200d88 t __frame_dummy_init_array_entry
- w __gmon_start__
- 0000000000200d98 t __init_array_end
- 0000000000200d88 t __init_array_start
- 0000000000000920 T __libc_csu_fini
- 00000000000008b0 T __libc_csu_init
- U __libc_start_main@@GLIBC_2.2.5
- 0000000000201010 D _edata
- 0000000000201138 B _end
- 0000000000000924 T _fini
- 0000000000000688 T _init
- 00000000000006f0 T _start
- 0000000000201130 b completed.7698
- 0000000000201000 W data_start
- 0000000000000720 t deregister_tm_clones
- 00000000000007f0 t frame_dummy
- 000000000000083d T main
- 0000000000000760 t register_tm_clones
當(dāng)前這個可執(zhí)行程序的文件大小是8840字節(jié):
- -rwxrwxrwx 1 a a 8840 Nov 29 14:54 a.out
使用strip清除符號信息:
- ~/test$ strip -s a.out
strip后再查看可執(zhí)行文件的符號信息:
- ~/test$ nm a.out nm: a.out: no symbols
發(fā)現(xiàn)什么符號都沒有了,但還是可以執(zhí)行。
strip后的可執(zhí)行程序文件大小是6120字節(jié):
- -rwxrwxrwx 1 a a 6120 Nov 29 14:54 a.out
具體可以看我這篇文章:《Linux有一個命令你一定要知道》
-fvisibility=hidden可以這樣使用:
- $ g++ -fvisibility=hidden -c layer.cxx -o layer.o
巧用.bss段:
看下面代碼:
- #include <stdio.h>
- int a[1000];
- int b[1000] = {1};
- int main() {
- printf("程序喵\n");
- return 0;
- }
我們查看下文件大小和各個段大?。?/p>
- $ gcc testlink.c -o test
- $ ls -l test
- -rwxrwxrwx 1 wzq wzq 12368 May 30 08:48 test
- $ size test
- text data bss dec hex filename
- 1512 4616 4032 10160 27b0 test
再看這段初始化的代碼:
- #include <stdio.h>
- int a[1000] = {1};
- int b[1000] = {1};
- int main() {
- printf("程序喵\n");
- return 0;
- }
再查看下文件大小和各個段大?。?/p>
- $ gcc testlink.c -o test
- $ ls -l test
- -rwxrwxrwx 1 wzq wzq 16368 May 30 08:49 test
- $ size test
- text data bss dec hex filename
- 1512 8616 8 10136 2798 test
可以看到僅僅是做了一次初始化,文件大小就從12368變成了16368,正好是初始化了的那a[1000]的大小,這4000字節(jié)從.bss段移動到了.data段,程序大小增加了,這里可以看出.bss段不占據(jù)磁盤空間。
巧用-fdata-sections和-ffunction-sections:
現(xiàn)在的程序和庫通常來講都很大,一個目標(biāo)文件可能包含成百上千個函數(shù)或變量,當(dāng)需要用到某個目標(biāo)文件的任意一個函數(shù)或變量時,就需要把它整個目標(biāo)文件都鏈接進(jìn)來,也就是說那些沒有用到的函數(shù)也會被鏈接進(jìn)去,這會導(dǎo)致鏈接輸出文件變的很大,造成空間浪費。
有一個編譯選項叫函數(shù)級別鏈接,可以使得某個函數(shù)或變量單獨保存在一個段里面,都鏈接器需要用到某個函數(shù)時,就將它合并到輸出文件中,對于沒用到的函數(shù)則將他們拋棄,減少空間浪費,但這會減慢編譯和鏈接過程,GCC編譯器的編譯選項是:
- -ffunction-sections -fdata-sections