Facebook的下一代數(shù)據(jù)中心網(wǎng)絡
上周五,在美國愛荷華州的小鎮(zhèn)阿爾圖納上,F(xiàn)acebook 的一個新的數(shù)據(jù)中心正式投入運營。盡管這個數(shù)據(jù)中心只不過是這家社交網(wǎng)絡巨頭肩負著信息交付的眾多計算設施里面的一個,但是相對而言,其內(nèi)部結構卻有點特別。
在以往,典型的數(shù)據(jù)網(wǎng)絡通常是一種分級匯聚的層次型結構,越是處在網(wǎng)絡的上層,對設備的處理能力要求就越高。過去一直是思科、Juniper 等公司壟斷著匯聚層、骨干層的設備。這些設備往往價格昂貴,而且擴展能力(相對)有限,一旦網(wǎng)絡流量增長到一定地步,唯有整機替換為下一代新設備才能支撐。而在 Facebook 的數(shù)據(jù)中心之間的流量是一個龐大的數(shù)字,其規(guī)模是 Facebook 流出流量的 1000 倍!所以傳統(tǒng)架構之下需要很多昂貴的網(wǎng)絡設備才能支撐這種規(guī)模的流量。
為此,F(xiàn)acebook 位于阿爾圖納的新數(shù)據(jù)中心則采用了一種新型的網(wǎng)絡結構、利用廉價的架頂交換機以模塊化的方式解決了傳統(tǒng)網(wǎng)絡公司無法解決的大規(guī)模計算網(wǎng)絡問題。
Facebook 的這種數(shù)據(jù)中心網(wǎng)絡結構叫做“Data Center Fabric(數(shù)據(jù)中心網(wǎng)絡)”。它放棄了傳統(tǒng)的分層結構以及昂貴的網(wǎng)絡設備,而是在整個網(wǎng)絡全面部署廉價的架頂交換機,利用一種全新的路由方式極大地改進數(shù)據(jù)中心的通信效率。在這個數(shù)據(jù)網(wǎng)絡中,其基本單位是一個個的 Pod,每個 Pod 包括 48 臺 10G 帶寬的架頂交換機以及 4 臺光纖交換機,每臺架頂交換機分別以一條 40G 的上行鏈路與光纖交換機互聯(lián),向下則接入底層的服務器。
此外,為了實現(xiàn)全網(wǎng)的連通性,F(xiàn)acebook 還設計了四個獨立的骨干交換機平面(plane),一個平面均可擴展至 48 臺設備。而每個 pod 的每一臺光纖交換機都會與所在平面的每一臺骨干交換機互聯(lián)。于是這些 pod 和 plane 就構成了一個模塊化的網(wǎng)絡拓撲,從而可以容納幾十萬臺 10G 帶寬的服務器,整個數(shù)據(jù)網(wǎng)絡的對分帶寬***可擴展至幾個 PB。而且這個數(shù)據(jù)中心網(wǎng)絡從網(wǎng)絡到服務器全網(wǎng)均采用 3 層協(xié)議(TCP/IP 中的網(wǎng)絡層),這樣的話數(shù)據(jù)路由可以更加靈活方便,而在網(wǎng)絡中間層不在需要昂貴的交換機去處理負載。
Facebook 這種以大量小型交換機替代少量大型交換機可以降低復雜性并提高可伸縮性,而且小型交換機競爭激烈的市場也使得網(wǎng)絡建設成本大為降低,從而使得數(shù)據(jù)中心網(wǎng)絡不僅更加高效,成本也顯著降低。
除了 Facebook 以外,其他的互聯(lián)網(wǎng)公司也正在朝著這一方向轉變。相比之下,傳統(tǒng)的數(shù)據(jù)中心將會日益缺乏競爭優(yōu)勢,這一點值得電信運營商密切注意,如果不改變其傳統(tǒng)的數(shù)據(jù)中心建設模式,也許未來就會被互聯(lián)網(wǎng)公司搶走飯碗。



















