偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

靈魂拷問：Java 的 substring() 是如何工作的？

作者：沉默王二 2019-11-19 10:32:55

開發(fā) 后端

在逛 programcreek 的時(shí)候，我發(fā)現(xiàn)了一些小而精悍的主題。比如說：Java 的 substring() 方法是如何工作的？像這類靈魂拷問的主題，非常值得深入地研究一下。

在逛 programcreek 的時(shí)候，我發(fā)現(xiàn)了一些小而精悍的主題。比如說：Java 的 substring() 方法是如何工作的?像這類靈魂拷問的主題，非常值得深入地研究一下。

另外，我想要告訴大家的是，研究的過程非常的有趣，就好像在迷宮里探寶一樣，起初有些不知所措，但經(jīng)過一番用心的摸索后，不但會(huì)找到寶藏，還會(huì)有一種茅塞頓開的感覺，非常棒。

對(duì)于絕大多數(shù)的初級(jí)程序員或者說不重視“內(nèi)功”的老鳥來說，往往停留在“知其然不知其所以然”的層面上——會(huì)用，但要說底層的原理，可就只能撓撓頭雙手一攤一張問號(hào)臉了。

很長(zhǎng)一段時(shí)間內(nèi)，我也一直處于這種層面上。但我決定改變了，因?yàn)?ldquo;內(nèi)功”就好像是在打地基，只有把地基打好了，才能蓋起經(jīng)得住考驗(yàn)的高樓大廈。借此機(jī)會(huì)，我就和大家一起，對(duì)“Java 的 substring() 是如何工作的”進(jìn)行一次深入地研究。注意了，準(zhǔn)備打怪升級(jí)了!

1、substring() 是干嘛的

sub是 subtract 的縮寫，因此 substring 的字面意思就是“把字符串做個(gè)減法”。這樣一分析，是不是感覺方法的命名還是蠻有講究的?

substring() 的完整寫法是 substring(int beginIndex, int endIndex)。該方法返回一個(gè)新的字符串，介于原有字符串的起始下標(biāo) beginIndex 和結(jié)尾下標(biāo) endIndex-1 之間。

String cmower = "沉默王二，一枚有趣的程序員"; 
cmower = cmower.substring(0, 4); 
System.out.println(cmower);

程序輸出的結(jié)果為：

沉默王二

為什么呢?我來簡(jiǎn)單解釋一下。

Java 的下標(biāo)都是從 0 開始編號(hào)的(我不確定有沒有從 1 開始的編程語(yǔ)言)，這和我們平常生活中從 1 開始編號(hào)的習(xí)慣不同。Java 這樣做的原因如下：

Java 是基于 C 語(yǔ)言實(shí)現(xiàn)的，而 C 語(yǔ)言的下標(biāo)是從 0 開始的——這聽起來好像是一句廢話。真正的原因是下標(biāo)并不是下標(biāo)，在指針(C)語(yǔ)言中，它實(shí)際上是一個(gè)偏移量，距離開始位置的一個(gè)偏移量。第一個(gè)元素在開頭，因此它的偏移量就為 0。

此外，還有另外一種說法。早期的計(jì)算機(jī)資源比較匱乏，0 作為起始下標(biāo)相比較于 1 作為起始下標(biāo)，編譯的效率更高。

知道了這層原因后，再來看上面這段代碼，就會(huì)豁然開朗。對(duì)于“沉默王二，一枚有趣的程序員”這串字符來說，“沉”的下標(biāo)為 0，“默”的下標(biāo)為 1，“王”的下標(biāo)為 2，“二”的下標(biāo)為 3，所以 cmower.substring(0, 4) 返回的字符串是“沉默王二”——包括起始下標(biāo)但不包括結(jié)尾下標(biāo)。

2、substring() 在被調(diào)用的時(shí)候究竟發(fā)生了什么?

在此之前，我們已經(jīng)了解到：字符串是不可變的，因此當(dāng)調(diào)用 substring() 方法的時(shí)候，返回的其實(shí)是一個(gè)新的字符串。那么變量 cmower 的地址引用就會(huì)發(fā)生如下圖所示的變化。

為了證明上圖是完全正確的，我們來看一下 JDK 7 中 substring() 的源碼。

public String(char value[], int offset, int count) { 
    //check boundary 
    this.value = Arrays.copyOfRange(value, offset, offset + count); 
} 
  
public String substring(int beginIndex, int endIndex) { 
    //check boundary 
    int subLen = endIndex - beginIndex; 
    return new String(value, beginIndex, subLen); 
}

可以看得出，substring() 通過 new String() 返回了一個(gè)新的字符串對(duì)象，在創(chuàng)建新的對(duì)象時(shí)通過 Arrays.copyOfRange() 復(fù)制了一個(gè)新的字符數(shù)組。

但 JDK 6 就有所不同。說到 JDK 6，可能有些讀者表示不服，JDK 6?什么年代了，JDK 13 都出來了好不好?但我想告訴大家的是，對(duì)比著剖析 JDK 的源碼，對(duì)學(xué)習(xí)大有裨益。

不是有那么一句話嘛，要想了解一個(gè)成功人士，不能只關(guān)注他發(fā)跡以后的事，更要關(guān)注他之前做了什么。

就請(qǐng)隨我來，看看 JDK 6 中的 substring() 的源碼吧。

//JDK 6 
String(int offset, int count, char value[]) { 
    this.value = value; 
    this.offset = offset; 
    this.count = count; 
} 
  
public String substring(int beginIndex, int endIndex) { 
    //check boundary 
    return  new String(offset + beginIndex, endIndex - beginIndex, value); 
}

substring() 方法本身和 JDK 7 并沒有很大的差別，都通過 new String() 返回了一個(gè)新的字符串對(duì)象。但是 String() 這個(gè)構(gòu)造函數(shù)有很大的差別，JDK 6 只是簡(jiǎn)單地更改了一下兩個(gè)屬性(offset 和 count)的值，value 并沒有變。

PS：value 是真正存儲(chǔ)字符的數(shù)組，offset 是數(shù)組中第一個(gè)元素的下標(biāo)，count 是數(shù)組中字符的個(gè)數(shù)。

這意味著什么呢?

調(diào)用 substring() 的時(shí)候雖然創(chuàng)建了新的字符串，但字符串的值仍然指向的是內(nèi)存中的同一個(gè)數(shù)組，如下圖所示。

3、為什么 JDK 7 的構(gòu)造函數(shù)發(fā)生了變化

看了 JDK 6 和 JDK 7 源碼之后，大家可能產(chǎn)生這樣一個(gè)疑惑：為什么 JDK 7 要做出改變呢?大家共用同一個(gè)字符串?dāng)?shù)組不是挺好的嘛，省得占用新的內(nèi)存空間。事實(shí)上呢?

如果有一個(gè)很長(zhǎng)很長(zhǎng)的字符串，可以繞地球一周，當(dāng)我們需要調(diào)用 substring() 截取其中很小一段字符串時(shí)，就有可能導(dǎo)致性能問題。由于這一小段字符串引用了整個(gè)很長(zhǎng)很長(zhǎng)的字符數(shù)組，就導(dǎo)致很長(zhǎng)很長(zhǎng)的這個(gè)字符數(shù)組無法被回收，內(nèi)存一直被占用著，就有可能引發(fā)內(nèi)存泄露。

PS：內(nèi)存泄露是指由于疏忽或錯(cuò)誤造成程序未能釋放已經(jīng)不再使用的內(nèi)存。

那 JDK 7 出現(xiàn)之前，這個(gè)隱患怎么應(yīng)對(duì)呢?答案如下。

cmower = cmower.substring(0, 4) + "";

為什么，為什么，為什么，多一個(gè) “+ ""” 就能解決內(nèi)存泄漏的問題?有些讀者可能不太相信，我來帶大家分析一下。

首先呢，我們通過 JAD 對(duì)字節(jié)碼反編譯一下，上面這行代碼就變成了如下內(nèi)容。

cmower = (new StringBuilder(String.valueOf(cmower.substring(0, 4)))).toString();

“+”號(hào)操作符就相當(dāng)于一個(gè)語(yǔ)法糖，加上空的字符串后，會(huì)被 JDK 轉(zhuǎn)化為 StringBuilder 對(duì)象，該對(duì)象在處理字符串的時(shí)候會(huì)生成新的字符數(shù)組，所以 cmower = cmower.substring(0, 4) + ""; 這行代碼執(zhí)行后，cmower 就指向了和 substring() 調(diào)用之前不同的字符數(shù)組。

PS：如果不明白“+”號(hào)操作符的工作原理，請(qǐng)查閱我之前寫的文章《羞，Java 字符串拼接竟然有這么多姿勢(shì)》，這里就不再贅述，免得被老讀者捶。

4、最后

總結(jié)一下，JDK 7 和 JDK 6 的 substring() 方法本身并沒有多大的改變，但 String 類的構(gòu)造函數(shù)有了很大的區(qū)別，JDK 7 會(huì)重新復(fù)制一份字符數(shù)組，而 JDK 6 不會(huì)，因此 JDK 6 在執(zhí)行比較長(zhǎng)的字符串 substring() 時(shí)可能會(huì)引發(fā)內(nèi)存泄露的問題。

責(zé)任編輯：華軒來源： Java極客技術(shù)

Java 語(yǔ)言程序員

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)