從零開(kāi)始學(xué)習(xí)Go語(yǔ)言的切片
這篇文章受到了我與同事討論使用切片作為棧的一次聊天的啟發(fā)。后來(lái)話題聊到了 Go 語(yǔ)言中的切片是如何工作的。我認(rèn)為這些信息對(duì)別人也有用,所以就把它記錄了下來(lái)。
數(shù)組
任何關(guān)于 Go 語(yǔ)言切片的討論都要從另一個(gè)數(shù)據(jù)結(jié)構(gòu)也就是數(shù)組開(kāi)始。Go 的數(shù)組有兩個(gè)特性:
- 數(shù)組的長(zhǎng)度是固定的;
[5]int是由 5 個(gè)int構(gòu)成的數(shù)組,和[3]int不同。 - 
    
數(shù)組是值類型??聪旅孢@個(gè)示例:
package mainimport "fmt"func main() {var a [5]intb := ab[2] = 7fmt.Println(a, b) // prints [0 0 0 0 0] [0 0 7 0 0]}
語(yǔ)句
b := a定義了一個(gè)類型是[5]int的新變量b,然后把a中的內(nèi)容 復(fù)制 到b中。改變b對(duì)a中的內(nèi)容沒(méi)有影響,因?yàn)?a和b是相互獨(dú)立的值。1 
切片
Go 語(yǔ)言的切片和數(shù)組的主要有如下兩個(gè)區(qū)別:
- 切片沒(méi)有一個(gè)固定的長(zhǎng)度。切片的長(zhǎng)度不是它類型定義的一部分,而是由切片內(nèi)部自己維護(hù)的。我們可以使用內(nèi)置的 
len函數(shù)知道它的長(zhǎng)度。2 - 將一個(gè)切片賦值給另一個(gè)切片時(shí) 不會(huì) 對(duì)切片內(nèi)容進(jìn)行復(fù)制操作。這是因?yàn)榍衅瑳](méi)有直接持有其內(nèi)部數(shù)據(jù),而是保留了一個(gè)指向 底層數(shù)組 3 的指針。數(shù)據(jù)都保留在底層數(shù)組里。
 
基于第二個(gè)特性,兩個(gè)切片可以享有共同的底層數(shù)組。看下面的示例:
- 
    
對(duì)切片取切片
package mainimport "fmt"func main() {var a = []int{1,2,3,4,5}b := a[2:]b[0] = 0fmt.Println(a, b) // prints [1 2 0 4 5] [0 4 5]}
在這個(gè)例子里,
a和b享有共同的底層數(shù)組 —— 盡管b在數(shù)組里的起始偏移量不同,兩者的長(zhǎng)度也不同。通過(guò)b修改底層數(shù)組的值也會(huì)導(dǎo)致a里的值的改變。 - 
    
將切片傳進(jìn)函數(shù)
package mainimport "fmt"func negate(s []int) {for i := range s {s[i] = -s[i]}}func main() {var a = []int{1, 2, 3, 4, 5}negate(a)fmt.Println(a) // prints [-1 -2 -3 -4 -5]}
在這個(gè)例子里,
a作為形參s的實(shí)參傳進(jìn)了negate函數(shù),這個(gè)函數(shù)遍歷s內(nèi)的元素并改變其符號(hào)。盡管nagate沒(méi)有返回值,且沒(méi)有訪問(wèn)到main函數(shù)里的a。但是當(dāng)將之傳進(jìn)negate函數(shù)內(nèi)時(shí),a里面的值卻被改變了。 
大多數(shù)程序員都能直觀地了解 Go 語(yǔ)言切片的底層數(shù)組是如何工作的,因?yàn)樗c其它語(yǔ)言中類似數(shù)組的工作方式類似。比如下面就是使用 Python 重寫的這一小節(jié)的第一個(gè)示例:
Python 2.7.10 (default, Feb 7 2017, 00:08:15)[GCC 4.2.1 Compatible Apple LLVM 8.0.0 (clang-800.0.34)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> a = [1,2,3,4,5]>>> b = a>>> b[2] = 0>>> a[1, 2, 0, 4, 5]
以及使用 Ruby 重寫的版本:
irb(main):001:0> a = [1,2,3,4,5]=> [1, 2, 3, 4, 5]irb(main):002:0> b = a=> [1, 2, 3, 4, 5]irb(main):003:0> b[2] = 0=> 0irb(main):004:0> a=> [1, 2, 0, 4, 5]
在大多數(shù)將數(shù)組視為對(duì)象或者是引用類型的語(yǔ)言也是如此。4
切片頭
切片同時(shí)擁有值和指針特性的神奇之處在于理解切片實(shí)際上是一個(gè)結(jié)構(gòu)體類型。通常在反射包內(nèi)相應(yīng)部分之后的這個(gè)結(jié)構(gòu)體被稱作切片頭。切片頭的定義大致如下:

package runtimetype slice struct {ptr unsafe.Pointerlen intcap int}
這很重要,因?yàn)楹?map 以及 chan 這兩個(gè)類型不同,切片是值類型,當(dāng)被賦值或者被作為參數(shù)傳入函數(shù)時(shí)候會(huì)被復(fù)制過(guò)去。
程序員們都能理解 square 的形參 v 和 main 中聲明的 v 的是相互獨(dú)立的。請(qǐng)看下面的例子:
package mainimport "fmt"func square(v int) {v = v * v}func main() {v := 3square(v)fmt.Println(v) // prints 3, not 9}
因此 square 對(duì)自己的形參 v 的操作沒(méi)有影響到 main 中的 v。下面這個(gè)示例中的 s 也是 main 中聲明的切片 s 的獨(dú)立副本, 而不是 指向 main 的 s 的指針。
package mainimport "fmt"func double(s []int) {s = append(s, s...)}func main() {s := []int{1, 2, 3}double(s)fmt.Println(s, len(s)) // prints [1 2 3] 3}
Go 的切片是作為值傳遞而不是指針這一點(diǎn)不太尋常。當(dāng)你在 Go 內(nèi)定義一個(gè)結(jié)構(gòu)體時(shí),90% 的時(shí)間里傳遞的都是這個(gè)結(jié)構(gòu)體的指針5 。切片的傳遞方式真的很不尋常,我能想到的唯一與之相同的例子只有 time.Time。
切片作為值傳遞而不是作為指針傳遞這一特殊行為會(huì)讓很多想要理解切片的工作原理的 Go 程序員感到困惑。你只需要記住,當(dāng)你對(duì)切片進(jìn)行賦值、取切片、傳參或者作為返回值等操作時(shí),你是在復(fù)制切片頭結(jié)構(gòu)的三個(gè)字段:指向底層數(shù)組的指針、長(zhǎng)度,以及容量。
總結(jié)
我們來(lái)用引出這一話題的切片作為棧的例子來(lái)總結(jié)下本文的內(nèi)容:
package mainimport "fmt"func f(s []string, level int) {if level > 5 {return}s = append(s, fmt.Sprint(level))f(s, level+1)fmt.Println("level:", level, "slice:", s)}func main() {f(nil, 0)}
在 main 函數(shù)的最開(kāi)始我們把一個(gè) nil 切片傳給了函數(shù) f 作為 level 0 。在函數(shù) f 里我們把當(dāng)前的 level 添加到切片的后面,之后增加 level 的值并進(jìn)行遞歸。一旦 level 大于 5,函數(shù)返回,打印出當(dāng)前的 level 以及它們復(fù)制到的 s 的內(nèi)容。
level: 5 slice: [0 1 2 3 4 5]level: 4 slice: [0 1 2 3 4]level: 3 slice: [0 1 2 3]level: 2 slice: [0 1 2]level: 1 slice: [0 1]level: 0 slice: [0]
你可以注意到在每一個(gè) level 內(nèi) s 的值沒(méi)有被別的 f 的調(diào)用影響,盡管當(dāng)計(jì)算更高的 level 時(shí)作為 append 的副產(chǎn)品,調(diào)用棧內(nèi)的四個(gè) f 函數(shù)創(chuàng)建了四個(gè)底層數(shù)組6 ,但是沒(méi)有影響到當(dāng)前各自的切片。
擴(kuò)展閱讀
如果你想要了解更多 Go 語(yǔ)言內(nèi)切片運(yùn)行的原理,我建議看看 Go 博客里的這些文章:
- Go Slices: usage and internals (blog.golang.org)
 - Arrays, slices (and strings): The mechanics of 'append' (blog.golang.org)
 
相關(guān)文章:
- If a map isn't a reference variable, what is it?
 - What is the zero value, and why is it useful?
 - The empty struct
 - Should methods be declared on T or *T
 
- 這不是數(shù)組才有的特性,在 Go 語(yǔ)言里中 一切 賦值都是復(fù)制過(guò)去的。
 - 你也可以在對(duì)數(shù)組使用 
len函數(shù),但是其結(jié)果本來(lái)就人盡皆知。 - 有時(shí)也叫做后臺(tái)數(shù)組,以及更不嚴(yán)謹(jǐn)?shù)恼f(shuō)法是后臺(tái)切片。
 - Go 語(yǔ)言里我們傾向于說(shuō)值類型以及指針類型,因?yàn)?C++ 的引用類型這個(gè)詞產(chǎn)生誤會(huì)。但在這里我認(rèn)為調(diào)用數(shù)組作為引用類型是沒(méi)有問(wèn)題的。
 - 如果你的結(jié)構(gòu)體有定義在其上的方法或者用于滿足某個(gè)接口,那么你傳入結(jié)構(gòu)體指針的比率可以飆升到接近 100%。
 - 證明留做習(xí)題。
 















 
 
 










 
 
 
 