每個(gè)程序員都必須知道的八種必須掌握數(shù)據(jù)結(jié)構(gòu)
數(shù)據(jù)結(jié)構(gòu)是一種在計(jì)算機(jī)中組織和存儲(chǔ)數(shù)據(jù)的專門方法,使我們可以更有效地對(duì)存儲(chǔ)的數(shù)據(jù)執(zhí)行操作。數(shù)據(jù)結(jié)構(gòu)在計(jì)算機(jī)科學(xué)和軟件工程領(lǐng)域有著廣泛而多樣的使用范圍。
幾乎所有已開發(fā)的程序或軟件系統(tǒng)都在使用數(shù)據(jù)結(jié)構(gòu)。此外,數(shù)據(jù)結(jié)構(gòu)屬于計(jì)算機(jī)科學(xué)和軟件工程的基礎(chǔ)知識(shí)。當(dāng)涉及到軟件工程面試問題時(shí),這是一個(gè)關(guān)鍵話題。因此,作為開發(fā)人員,我們必須對(duì)數(shù)據(jù)結(jié)構(gòu)有很好的了解。
在這篇文章中,我將簡(jiǎn)要解釋每個(gè)程序員都必須了解的 8 種常用數(shù)據(jù)結(jié)構(gòu)。
1、數(shù)組(Arrays)
數(shù)組是一種固定大小的結(jié)構(gòu),可以容納相同數(shù)據(jù)類型的項(xiàng)。它可以是整數(shù)數(shù)組、浮點(diǎn)數(shù)數(shù)組、字符串?dāng)?shù)組甚至數(shù)組的數(shù)組(例如二維數(shù)組)。數(shù)組是有索引的,這意味著可以進(jìn)行隨機(jī)訪問。
數(shù)組運(yùn)算
- 遍歷:遍歷元素并打印它們。
- 搜索:搜索數(shù)組中的元素。您可以按元素的值或索引搜索元素
- 更新:更新給定索引處現(xiàn)有元素的值
由于數(shù)組的大小是固定的,因此無法立即向數(shù)組插入元素和從數(shù)組中刪除元素。如果要將元素插入數(shù)組,首先必須創(chuàng)建一個(gè)大小增加的新數(shù)組(當(dāng)前大小 + 1),復(fù)制現(xiàn)有元素并添加新元素。對(duì)于刪除尺寸減小的新數(shù)組也是如此。
數(shù)組的應(yīng)用
- 用作構(gòu)建其他數(shù)據(jù)結(jié)構(gòu)(例如數(shù)組列表、堆、哈希表、向量和矩陣)的構(gòu)建塊。
- 用于不同的排序算法,例如插入排序、快速排序、冒泡排序和合并排序。
2、鏈表(Linked Lists)
鏈表是一種順序結(jié)構(gòu),由一系列按線性順序相互鏈接的項(xiàng)目組成。因此,您必須順序訪問數(shù)據(jù),而隨機(jī)訪問是不可能的。鏈接列表提供了動(dòng)態(tài)集的簡(jiǎn)單而靈活的表示。
讓我們考慮以下有關(guān)鏈表的術(shù)語。
- 鏈表中的元素稱為節(jié)點(diǎn)。
- 每個(gè)節(jié)點(diǎn)都包含一個(gè)鍵和一個(gè)指向其后繼節(jié)點(diǎn)(稱為next )的指針。
- 名為head 的屬性指向鏈表的第一個(gè)元素。
- 鏈表的最后一個(gè)元素稱為尾部。
以下是可用的各種類型的鏈接列表。
- 單鏈表——項(xiàng)目的遍歷只能向前進(jìn)行。
- 雙向鏈表——可以向前和向后兩個(gè)方向遍歷項(xiàng)目。節(jié)點(diǎn)由一個(gè)稱為prev的附加指針組成,指向前一個(gè)節(jié)點(diǎn)。
- 循環(huán)鏈表——頭部的prev指針指向尾部,尾部的next指針指向頭部的鏈表。
鏈表操作
- 搜索:通過簡(jiǎn)單的線性搜索找到給定鏈表中第一個(gè)具有鍵k的元素,并返回指向該元素的指針
- 插入:向鏈表插入一個(gè)鍵。插入可以通過 3 種不同的方式完成;插入在列表的開頭,插入在列表的末尾,插入在列表的中間。
- 刪除:從給定的鏈表中刪除元素x 。您無法通過一步刪除節(jié)點(diǎn)??梢酝ㄟ^ 3 種不同的方式進(jìn)行刪除;從列表開頭刪除、從列表末尾刪除、從列表中間刪除。
鏈表的應(yīng)用
- 用于編譯器設(shè)計(jì)中的符號(hào)表管理。
- 用于使用 Alt + Tab 在程序之間切換(使用循環(huán)鏈表實(shí)現(xiàn))。
3、堆棧(Stacks)
堆棧是一種LIFO(后進(jìn)先出 - 最后放置的元素可以首先訪問)結(jié)構(gòu),在許多編程語言中都很常見。這種結(jié)構(gòu)被命名為“堆棧”,因?yàn)樗愃朴诂F(xiàn)實(shí)世界中的堆?!欢驯P子。
堆棧操作
下面給出了可以在堆棧上執(zhí)行的 2 個(gè)基本操作。
- Push:將一個(gè)元素插入到棧頂。
- Pop:刪除最上面的元素并返回。
此外,還為堆棧提供了以下附加函數(shù)以檢查其狀態(tài)。
- Peek:返回棧頂元素而不刪除它。
- isEmpty:檢查堆棧是否為空。
- isFull:檢查堆棧是否已滿。
棧的應(yīng)用
- 用于表達(dá)式求值(例如:用于解析和求值數(shù)學(xué)表達(dá)式的調(diào)車場(chǎng)算法)。
- 用于實(shí)現(xiàn)遞歸編程中的函數(shù)調(diào)用。
4、隊(duì)列(Queues)
隊(duì)列是一種FIFO(先進(jìn)先出——先放置的元素可以先訪問)結(jié)構(gòu),在許多編程語言中都很常見。這種結(jié)構(gòu)被命名為“隊(duì)列”,因?yàn)樗愃朴诂F(xiàn)實(shí)世界的隊(duì)列——人們?cè)陉?duì)列中等待。
隊(duì)列操作
下面給出了可以在隊(duì)列上執(zhí)行的 2 個(gè)基本操作。
- Enqueue:將一個(gè)元素插入到隊(duì)列末尾。
- Dequeue:從隊(duì)列開頭刪除元素。
隊(duì)列的應(yīng)用
- 用于管理多線程中的線程。
- 用于實(shí)現(xiàn)排隊(duì)系統(tǒng)(例如:優(yōu)先級(jí)隊(duì)列)。
5、哈希表(Hash Tables)
哈希表是一種存儲(chǔ)值的數(shù)據(jù)結(jié)構(gòu),這些值具有與每個(gè)值關(guān)聯(lián)的鍵。此外,如果我們知道與值關(guān)聯(lián)的鍵,它就可以有效地支持查找。因此,無論數(shù)據(jù)大小如何,插入和搜索都非常有效。
直接尋址在表中存儲(chǔ)時(shí)使用值和鍵之間的一對(duì)一映射。但是,當(dāng)存在大量鍵值對(duì)時(shí),這種方法會(huì)出現(xiàn)問題。該表將非常龐大,包含如此多的記錄,并且考慮到典型計(jì)算機(jī)上的可用內(nèi)存,可能不切實(shí)際甚至不可能進(jìn)行存儲(chǔ)。為了避免這個(gè)問題,我們使用哈希表。
哈希函數(shù)
稱為散列函數(shù)(h)的特殊函數(shù)用于克服直接尋址中的上述問題。
在直接訪問中,具有鍵k的值存儲(chǔ)在槽k中。使用哈希函數(shù),我們計(jì)算每個(gè)值所在的表(槽)的索引。使用哈希函數(shù)對(duì)給定鍵計(jì)算出的值稱為哈希值,它指示該值映射到的表的索引。
h(k) = k % m
- h:哈希函數(shù)。
- k:需要確定哈希值的Key。
- m:哈希表的大?。捎貌鄣臄?shù)量)。對(duì)于m來說,不接近 2 的精確冪的素?cái)?shù)是一個(gè)不錯(cuò)的選擇。
考慮哈希函數(shù)h(k) = k % 20,其中哈希表的大小為 20。給定一組鍵,我們要計(jì)算每個(gè)鍵的哈希值,以確定它在哈希表中應(yīng)位于的索引??紤]我們有以下鍵、哈希和哈希表索引。
- 1 → 1%20 → 1
- 5 → 5%20 → 5
- 23 → 23%20 → 3
- 63 → 63%20 → 3
從上面給出的最后兩個(gè)示例中,我們可以看到,當(dāng)哈希函數(shù)為多個(gè)鍵生成相同的索引時(shí),可能會(huì)出現(xiàn)沖突。我們可以通過選擇合適的哈希函數(shù) h 并使用鏈接和開放尋址等技術(shù)來解決沖突。
哈希表的應(yīng)用
- 用于實(shí)現(xiàn)數(shù)據(jù)庫索引。
- 用于實(shí)現(xiàn)關(guān)聯(lián)數(shù)組。
- 用于實(shí)現(xiàn)“集合”數(shù)據(jù)結(jié)構(gòu)。
6、樹(Trees)
樹是一種層次結(jié)構(gòu),其中數(shù)據(jù)按層次結(jié)構(gòu)組織并鏈接在一起。這種結(jié)構(gòu)與鏈表不同,而在鏈表中,項(xiàng)目以線性順序鏈接。
在程序的應(yīng)用中,為了適應(yīng)某些應(yīng)用并滿足某些限制,已經(jīng)開發(fā)了各種類型的樹木。一些例子是二叉搜索樹、B樹、treap、紅黑樹、splay樹、AVL樹和n叉樹。
二叉搜索樹
二叉搜索樹(BST),顧名思義,是一種二叉樹,其中數(shù)據(jù)以層次結(jié)構(gòu)組織。該數(shù)據(jù)結(jié)構(gòu)按排序順序存儲(chǔ)值。
二叉搜索樹中的每個(gè)節(jié)點(diǎn)都包含以下屬性。
- key:存儲(chǔ)在節(jié)點(diǎn)中的值。
- left:指向左孩子的指針。
- right:指向右孩子的指針。
- p:指向父節(jié)點(diǎn)的指針。
二叉搜索樹具有區(qū)別于其他樹的獨(dú)特屬性。該屬性稱為二叉搜索樹屬性。
令x為二叉搜索樹中的一個(gè)節(jié)點(diǎn)。
- 如果y是x左子樹中的節(jié)點(diǎn),則y.key ≤ x.key。
- 如果y是x右子樹中的節(jié)點(diǎn),則y.key ≥ x.key。
樹的應(yīng)用
- 二叉樹:用于實(shí)現(xiàn)表達(dá)式解析器和表達(dá)式求解器。
- 二叉搜索樹:用于許多數(shù)據(jù)不斷進(jìn)入和離開的搜索應(yīng)用程序。
- 堆:JVM(Java 虛擬機(jī))用來存儲(chǔ) Java 對(duì)象。
- Treaps:用于無線網(wǎng)絡(luò)。
7、堆(Heaps)
堆是二叉樹的一種特殊情況,其中父節(jié)點(diǎn)與其子節(jié)點(diǎn)的值進(jìn)行比較,并進(jìn)行相應(yīng)的排列。
讓我們看看如何表示堆。堆可以使用樹和數(shù)組來表示。下面兩張圖顯示了如何使用二叉樹和數(shù)組來表示二叉堆。
堆可以有兩種類型
- 最小堆— 父級(jí)的鍵小于或等于其子級(jí)的鍵。這稱為最小堆屬性。根將包含堆的最小值。
- 最大堆— 父級(jí)的鍵大于或等于其子級(jí)的鍵。這稱為最大堆屬性。根將包含堆的最大值。
堆的應(yīng)用
- 用于堆排序算法。
- 用于實(shí)現(xiàn)優(yōu)先級(jí)隊(duì)列,因為可以根據(jù)堆屬性對(duì)優(yōu)先級(jí)值進(jìn)行排序,其中堆可以使用數(shù)組來實(shí)現(xiàn)。
- 隊(duì)列函數(shù)可以在O(log n)時(shí)間內(nèi)使用堆實(shí)現(xiàn)。
- 用于查找給定數(shù)組中 k?? 的最小(或最大)值。
8、圖表(Graphs)
圖由一組有限的頂點(diǎn)或節(jié)點(diǎn)以及一組連接這些頂點(diǎn)的邊組成。
圖的階數(shù)是圖中頂點(diǎn)的數(shù)量。圖的大小是圖中邊的數(shù)量。
如果兩個(gè)節(jié)點(diǎn)通過同一條邊相互連接,則稱它們是相鄰的。
有向圖
如果圖G的所有邊都具有指示起始頂點(diǎn)和終止頂點(diǎn)的方向,則稱圖 G 是有向圖。
我們說(u, v)是從頂點(diǎn)u入射或離開頂點(diǎn)u ,并且是從頂點(diǎn) v 入射或進(jìn)入頂點(diǎn)v。
自循環(huán):從頂點(diǎn)到自身的邊。
無向圖
如果圖G的所有邊都沒有方向,則稱其為無向圖。它可以在兩個(gè)頂點(diǎn)之間雙向移動(dòng)。
如果一個(gè)頂點(diǎn)沒有連接到圖中的任何其他節(jié)點(diǎn),則稱該頂點(diǎn)是孤立的。
圖的應(yīng)用
- 用于表示社交媒體網(wǎng)絡(luò)。每個(gè)用戶都是一個(gè)頂點(diǎn),當(dāng)用戶連接時(shí),他們會(huì)創(chuàng)建一條邊。
- 用于表示搜索引擎的網(wǎng)頁和鏈接?;ヂ?lián)網(wǎng)上的網(wǎng)頁通過超鏈接相互鏈接。每個(gè)頁面是一個(gè)頂點(diǎn),兩個(gè)頁面之間的超鏈接是一條邊。用于百度中的頁面排名。
- 用于表示 GPS 中的位置和路線。位置是頂點(diǎn),連接位置的路線是邊。用于計(jì)算兩個(gè)位置之間的最短路線。
總結(jié)
還有很多種數(shù)據(jù)結(jié)構(gòu),其實(shí)都是基于以上數(shù)據(jù)結(jié)構(gòu)變種生成的,數(shù)據(jù)結(jié)構(gòu)是每個(gè)程序員都要掌握的,無論是工作中還是面試都必不可少的知識(shí)儲(chǔ)備。