偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

靈魂拷問:Java 的 substring() 是如何工作的?

開發(fā) 后端
在逛 programcreek 的時候,我發(fā)現(xiàn)了一些小而精悍的主題。比如說:Java 的 substring() 方法是如何工作的?像這類靈魂拷問的主題,非常值得深入地研究一下。

 在逛 programcreek 的時候,我發(fā)現(xiàn)了一些小而精悍的主題。比如說:Java 的 substring() 方法是如何工作的?像這類靈魂拷問的主題,非常值得深入地研究一下。

[[282826]]

另外,我想要告訴大家的是,研究的過程非常的有趣,就好像在迷宮里探寶一樣,起初有些不知所措,但經(jīng)過一番用心的摸索后,不但會找到寶藏,還會有一種茅塞頓開的感覺,非常棒。

對于絕大多數(shù)的初級程序員或者說不重視“內(nèi)功”的老鳥來說,往往停留在“知其然不知其所以然”的層面上——會用,但要說底層的原理,可就只能撓撓頭雙手一攤一張問號臉了。

很長一段時間內(nèi),我也一直處于這種層面上。但我決定改變了,因為“內(nèi)功”就好像是在打地基,只有把地基打好了,才能蓋起經(jīng)得住考驗的高樓大廈。借此機會,我就和大家一起,對“Java 的 substring() 是如何工作的”進行一次深入地研究。注意了,準(zhǔn)備打怪升級了!

1、substring() 是干嘛的

sub是 subtract 的縮寫,因此 substring 的字面意思就是“把字符串做個減法”。這樣一分析,是不是感覺方法的命名還是蠻有講究的?

substring() 的完整寫法是 substring(int beginIndex, int endIndex)。該方法返回一個新的字符串,介于原有字符串的起始下標(biāo) beginIndex 和結(jié)尾下標(biāo) endIndex-1 之間。

 

  1. String cmower = "沉默王二,一枚有趣的程序員"
  2. cmower = cmower.substring(0, 4); 
  3. System.out.println(cmower); 

程序輸出的結(jié)果為:

沉默王二

為什么呢?我來簡單解釋一下。

Java 的下標(biāo)都是從 0 開始編號的(我不確定有沒有從 1 開始的編程語言),這和我們平常生活中從 1 開始編號的習(xí)慣不同。Java 這樣做的原因如下:

Java 是基于 C 語言實現(xiàn)的,而 C 語言的下標(biāo)是從 0 開始的——這聽起來好像是一句廢話。真正的原因是下標(biāo)并不是下標(biāo),在指針(C)語言中,它實際上是一個偏移量,距離開始位置的一個偏移量。第一個元素在開頭,因此它的偏移量就為 0。

此外,還有另外一種說法。早期的計算機資源比較匱乏,0 作為起始下標(biāo)相比較于 1 作為起始下標(biāo),編譯的效率更高。

知道了這層原因后,再來看上面這段代碼,就會豁然開朗。對于“沉默王二,一枚有趣的程序員”這串字符來說,“沉”的下標(biāo)為 0,“默”的下標(biāo)為 1,“王”的下標(biāo)為 2,“二”的下標(biāo)為 3,所以 cmower.substring(0, 4) 返回的字符串是“沉默王二”——包括起始下標(biāo)但不包括結(jié)尾下標(biāo)。

2、substring() 在被調(diào)用的時候究竟發(fā)生了什么?

在此之前,我們已經(jīng)了解到:字符串是不可變的,因此當(dāng)調(diào)用 substring() 方法的時候,返回的其實是一個新的字符串。那么變量 cmower 的地址引用就會發(fā)生如下圖所示的變化。

 

 

 

 

為了證明上圖是完全正確的,我們來看一下 JDK 7 中 substring() 的源碼。

 

  1. public String(char value[], int offset, int count) { 
  2.     //check boundary 
  3.     this.value = Arrays.copyOfRange(value, offset, offset + count); 
  4.   
  5. public String substring(int beginIndex, int endIndex) { 
  6.     //check boundary 
  7.     int subLen = endIndex - beginIndex; 
  8.     return new String(value, beginIndex, subLen); 

可以看得出,substring() 通過 new String() 返回了一個新的字符串對象,在創(chuàng)建新的對象時通過 Arrays.copyOfRange() 復(fù)制了一個新的字符數(shù)組。

但 JDK 6 就有所不同。說到 JDK 6,可能有些讀者表示不服,JDK 6?什么年代了,JDK 13 都出來了好不好?但我想告訴大家的是,對比著剖析 JDK 的源碼,對學(xué)習(xí)大有裨益。

不是有那么一句話嘛,要想了解一個成功人士,不能只關(guān)注他發(fā)跡以后的事,更要關(guān)注他之前做了什么。

就請隨我來,看看 JDK 6 中的 substring() 的源碼吧。

 

  1. //JDK 6 
  2. String(int offset, int countchar value[]) { 
  3.     this.value = value; 
  4.     this.offset = offset; 
  5.     this.count = count
  6.   
  7. public String substring(int beginIndex, int endIndex) { 
  8.     //check boundary 
  9.     return  new String(offset + beginIndex, endIndex - beginIndex, value); 

substring() 方法本身和 JDK 7 并沒有很大的差別,都通過 new String() 返回了一個新的字符串對象。但是 String() 這個構(gòu)造函數(shù)有很大的差別,JDK 6 只是簡單地更改了一下兩個屬性(offset 和 count)的值,value 并沒有變。

PS:value 是真正存儲字符的數(shù)組,offset 是數(shù)組中第一個元素的下標(biāo),count 是數(shù)組中字符的個數(shù)。

這意味著什么呢?

調(diào)用 substring() 的時候雖然創(chuàng)建了新的字符串,但字符串的值仍然指向的是內(nèi)存中的同一個數(shù)組,如下圖所示。

 

 

 

 

3、為什么 JDK 7 的構(gòu)造函數(shù)發(fā)生了變化

看了 JDK 6 和 JDK 7 源碼之后,大家可能產(chǎn)生這樣一個疑惑:為什么 JDK 7 要做出改變呢?大家共用同一個字符串?dāng)?shù)組不是挺好的嘛,省得占用新的內(nèi)存空間。事實上呢?

如果有一個很長很長的字符串,可以繞地球一周,當(dāng)我們需要調(diào)用 substring() 截取其中很小一段字符串時,就有可能導(dǎo)致性能問題。由于這一小段字符串引用了整個很長很長的字符數(shù)組,就導(dǎo)致很長很長的這個字符數(shù)組無法被回收,內(nèi)存一直被占用著,就有可能引發(fā)內(nèi)存泄露。

PS:內(nèi)存泄露是指由于疏忽或錯誤造成程序未能釋放已經(jīng)不再使用的內(nèi)存。

那 JDK 7 出現(xiàn)之前,這個隱患怎么應(yīng)對呢?答案如下。

 

  1. cmower = cmower.substring(0, 4) + ""

為什么,為什么,為什么,多一個 “+ ""” 就能解決內(nèi)存泄漏的問題?有些讀者可能不太相信,我來帶大家分析一下。

首先呢,我們通過 JAD 對字節(jié)碼反編譯一下,上面這行代碼就變成了如下內(nèi)容。

 

  1. cmower = (new StringBuilder(String.valueOf(cmower.substring(0, 4)))).toString(); 

“+”號操作符就相當(dāng)于一個語法糖,加上空的字符串后,會被 JDK 轉(zhuǎn)化為 StringBuilder 對象,該對象在處理字符串的時候會生成新的字符數(shù)組,所以 cmower = cmower.substring(0, 4) + ""; 這行代碼執(zhí)行后,cmower 就指向了和 substring() 調(diào)用之前不同的字符數(shù)組。

PS:如果不明白“+”號操作符的工作原理,請查閱我之前寫的文章《羞,Java 字符串拼接竟然有這么多姿勢》,這里就不再贅述,免得被老讀者捶。

4、最后

總結(jié)一下,JDK 7 和 JDK 6 的 substring() 方法本身并沒有多大的改變,但 String 類的構(gòu)造函數(shù)有了很大的區(qū)別,JDK 7 會重新復(fù)制一份字符數(shù)組,而 JDK 6 不會,因此 JDK 6 在執(zhí)行比較長的字符串 substring() 時可能會引發(fā)內(nèi)存泄露的問題。

責(zé)任編輯:華軒 來源: Java極客技術(shù)
相關(guān)推薦

2020-06-02 07:44:04

AQS JavaNode

2019-07-29 10:10:06

Java內(nèi)存線程安全

2020-05-29 11:48:01

安全運維信息安全網(wǎng)絡(luò)安全

2019-08-12 11:14:00

JVM垃圾對象

2019-08-01 10:20:10

2020-05-22 08:13:45

敏捷開發(fā)OKR

2022-12-12 08:46:11

2022-05-30 18:37:03

數(shù)據(jù)個人信息人工智能

2022-03-16 18:27:39

開發(fā)低代碼軟件開發(fā)

2022-08-26 01:10:32

TCPSYNLinux

2025-04-07 00:00:00

云原生架構(gòu)Kubernetes

2017-11-17 09:13:31

Java注解

2021-06-02 09:47:48

RSA2021

2021-05-26 05:22:48

SQL 數(shù)據(jù)庫SELECT

2023-06-16 14:10:00

TCPUDP網(wǎng)絡(luò)通信

2011-08-08 13:45:58

jQuery

2021-05-10 17:20:55

AIOps開發(fā)人員人工智能

2012-06-20 10:01:55

開源云計算

2021-03-12 09:24:58

Redis面試場景

2023-03-06 00:27:02

Kubernetesscheduler系統(tǒng)
點贊
收藏

51CTO技術(shù)棧公眾號