JAVA的字符串拼接與性能
概述:本文主要研究的是JAVA的字符串拼接的性能,原文中的測試代碼在功能上并不等價,導(dǎo)致concat的測試意義不大。不過原作者在評論欄給了新的concat結(jié)果,如果有興趣的同學(xué)建議自己修改代碼測試。
原文出處:http://www.venishjoe.net/2009/11/java-string-concatenation-and.html
在JAVA中拼接兩個字符串的最簡便的方式就是使用操作符”+”了。如果你用”+”來連接固定長度的字符串,可能性能上會稍受影響,但是如果你是在 循環(huán)中來”+”多個串的話,性能將指數(shù)倍的下降。假設(shè)有一個字符串,我們將對這個字符串做大量循環(huán)拼接操作,使用”+”的話將得到***的性能。但是究竟這 個性能有多差?如果我們同時也把StringBuffer,StringBuilder或String.concat()放入性能測試中,結(jié)果又會如何 呢?本文將會就這些問題給出一個答案!
我們將使用Per4j來計算性能,因為這個工具可以給我們一個完整的性能指標(biāo)集合,比如最小,***耗時,統(tǒng)計時間段的標(biāo)準(zhǔn)偏差等。在測試代碼中,為了得到一個準(zhǔn)確的標(biāo)準(zhǔn)偏差值,我們將執(zhí)行20個拼接”*”50,000次的測試。下面是我們將使用到的拼接字符串的方法:
- Concatenation Operator (+)
- String concat method – concat(String str)
- StringBuffer append method – append(String str)
- StringBuilder append method – append(String str)
***,我們將看看字節(jié)碼,來研究這些方法到底是如何執(zhí)行的。現(xiàn)在,讓我們先開始來創(chuàng)建我捫的類。注意為了計算每個循環(huán)的性能,代碼中的每段測試代碼都需要用Per4J庫進行封裝。首先我們先定義迭代次數(shù)
- private static final int OUTER_ITERATION=20;
- private static final int INNER_ITERATION=50000;
接下來,我們將使用上述4個方法來實現(xiàn)我們的測試代碼。
- String addTestStr = "";
- String concatTestStr = "";
- StringBuffer concatTestSb = null;
- StringBuilder concatTestSbu = null;
- for (int outerIndex=0;outerIndex<=OUTER_ITERATION;outerIndex++) {
- StopWatch stopWatch = new LoggingStopWatch("StringAddConcat");
- addTestStr = "";
- for (int innerIndex=0;innerIndex<=INNER_ITERATION;innerIndex++)
- addTestStr += "*";
- stopWatch.stop();
- }
- for (int outerIndex=0;outerIndex<=OUTER_ITERATION;outerIndex++) {
- StopWatch stopWatch = new LoggingStopWatch("StringConcat");
- concatTestStr = "";
- for (int innerIndex=0;innerIndex<=INNER_ITERATION;innerIndex++)
- concatTestStr.concat("*");
- stopWatch.stop();
- }
- for (int outerIndex=0;outerIndex<=OUTER_ITERATION;outerIndex++) {
- StopWatch stopWatch = new LoggingStopWatch("StringBufferConcat");
- concatTestSb = new StringBuffer();
- for (int innerIndex=0;innerIndex<=INNER_ITERATION;innerIndex++)
- concatTestSb.append("*");
- stopWatch.stop();
- }
- for (int outerIndex=0;outerIndex<=OUTER_ITERATION;outerIndex++) {
- StopWatch stopWatch = new LoggingStopWatch("StringBuilderConcat");
- concatTestSbu = new StringBuilder();
- for (int innerIndex=0;innerIndex<=INNER_ITERATION;innerIndex++)
- concatTestSbu.append("*");
- stopWatch.stop();
- }
接下來通過運行程序來生成性能指標(biāo)。我的運行環(huán)境是64位的Windown7操作系統(tǒng),32位的JVM(7-ea) 帶4GB內(nèi)存,雙核Quad 2.00GHz的CPU的機器.
經(jīng)過20次迭代后,我們得到如下的數(shù)據(jù):

結(jié)果非常***如我們想象的那樣。唯一比較有趣的事情是為什么String.concat也很不錯,我們都知道,String是一個常類(初始化后就不會改變的類),那么為什么concat的性能會更好一些呢。(譯者注: 其實原文作者的測試代碼有問題,對于concat()方法的測試代碼應(yīng)該寫成 concatTestStr=concatTestStr.concat(“*”)才對。)為了回答這個問題,我們應(yīng)該看看concat反編譯出來的字節(jié) 碼。在本文的下載包里面包含了所有的字節(jié)碼,但是現(xiàn)在我們先看一下concat的這個代碼片段:
- 46: new #6; //class java/lang/StringBuilder
- 49: dup
- 50: invokespecial #7; //Method java/lang/StringBuilder."<init>":()V
- 53: aload_1
- 54: invokevirtual #8; //Method java/lang/StringBuilder.append:
- (Ljava/lang/String;)Ljava/lang/StringBuilder;
- 57: ldc #9; //String *
- 59: invokevirtual #8; //Method java/lang/StringBuilder.append:
- (Ljava/lang/String;)Ljava/lang/StringBuilder;
- 62: invokevirtual #10; //Method java/lang/StringBuilder.toString:()
- Ljava/lang/String;
- 65: astore_1
- 66: iinc 7, 1
- 69: goto 38
這段代碼是String.concat()的字節(jié)碼,從這段代碼中,我們可以清楚的看到,concat()方法使用了 StringBuilder,concat()的性能應(yīng)該和StringBuilder的一樣好,但是由于額外的創(chuàng)建StringBuilder和 做.append(str).append(str).toString()的操作,使得concate的性能會受到一些影響,所以 StringBuilder和String Cancate的時間是1.8和3.3。
因此,即時在做最簡單的拼接時,如果我們不想創(chuàng)建StringBuffer或StringBuilder實例使,我們也因該使用concat。但是對于大量的字符串拼接操作,我們就不應(yīng)該使用concat(譯者注:因 為測試代碼功能上并不完全等價,更換后的測試代碼concat的平均處理時間是1650.9毫秒。這個結(jié)果在原文的評論里面。),因為concat會降低 你程序的性能,消耗你的cpu。因此,在不考慮線程安全和同步的情況下,為了獲得***的性能,我們應(yīng)盡量使用StringBuilder
本文的源代碼,編譯目標(biāo)文件和字節(jié)碼可以通過下面的這個鏈接獲得:
下載源代碼,類和字節(jié)碼:String_Concatenation _Performance.zip
原文鏈接:http://www.venishjoe.net/2009/11/java-string-concatenation-and.html



























