關(guān)于應(yīng)對混合云存儲若干技術(shù)挑戰(zhàn)的思考
譯文改用混合云存儲模式有助于應(yīng)對安全和合規(guī)方面的問題,但隨之帶來了諸如數(shù)據(jù)同步和廣域網(wǎng)延遲之類的問題。
數(shù)據(jù)安全和合規(guī)問題幫助促使企業(yè)對混合云而不是純公有云或純私有云解決方案產(chǎn)生興趣。在這種混合模式下,公司的一部分?jǐn)?shù)據(jù)駐留在私有云上,一部分?jǐn)?shù)據(jù)駐留在公有云上,而大部分?jǐn)?shù)據(jù)駐留在私有云和公有云上。
然而,混合云存儲方案也有其問題。雖然它確實有助于應(yīng)對合規(guī)問題,但是無法消除合規(guī)問題。仍然面臨合規(guī)問題,限制了哪些數(shù)據(jù)可以進入到公有云,或者駐留在公有云和私有云上。與此同時,暫時將數(shù)據(jù)拷貝到公有云花費太多的時間、耗用太多的帶寬,因而處理負載激增的“云爆發(fā)”(cloud-bursting)這個概念遭遇這個現(xiàn)實:拷貝在云端創(chuàng)建新實例所需的數(shù)據(jù)所花的時間可能比負載激增持續(xù)時間還長。
另一個問題是數(shù)據(jù)同步。一旦主副本數(shù)據(jù)發(fā)生了變化,你如何防止公共實例因使用或創(chuàng)建非同步的信息而“踐踏”私有數(shù)據(jù)?
來自初創(chuàng)企業(yè)和大牌廠商的眾多產(chǎn)品試圖解決這些問題。Nirvanix、StoreSimple、Nasuni和Twinstrata等公司提供緩存網(wǎng)關(guān),但這些產(chǎn)品都受制于廣域網(wǎng)在普通操作中的速度。這些網(wǎng)關(guān)看起來就像NAS文件管理器或云(分別是NFS協(xié)議或REST協(xié)議)。數(shù)據(jù)寫入到本地緩存中,然后通常經(jīng)過壓縮后,重新寫入到云端。本地磁盤或固態(tài)硬盤充當(dāng)讀取緩存,以加快最近文件的交付。
如果改用這樣一種新的混合模式:數(shù)據(jù)仍然留在私有云,但可以由公有云中的新實例來訪問,它會直接面臨典型廣域網(wǎng)連接的低速度和高延遲這個問題。延遲會長達數(shù)毫秒,相比之下私有云的延遲只有數(shù)微秒,這意味著公共實例將效率低下、速度緩慢。
有幾個辦法可以改善這種情形。最有用的一種辦法就是,結(jié)合運用緩存和數(shù)據(jù)壓縮,以減少廣域網(wǎng)流量。壓縮和緩存的好處取決于具體的使用場合,但通常而言壓縮可以實現(xiàn)耗用帶寬縮減約6倍(云端的存儲數(shù)據(jù)也可以縮減約6倍),同時緩存通??梢詫⒘髁繙p少約4倍。這兩種方法可以結(jié)合使用,但是面臨性能挑戰(zhàn),如果與固態(tài)硬盤操作相比更是如此,因為壓縮和緩存查詢都是計算密集型操作。
提高廣域網(wǎng)連接的速度是另一個辦法。遺憾的是,在美國,電信公司覺得市場對光纖互聯(lián)網(wǎng)鏈路的需求不大。這將廣域網(wǎng)鏈路的速度限制在通常只有每秒50兆位(50 Mbps),甚至更低,而這跟不上如今單只硬盤的速度。
主機托管的私有存儲可以在一定程度上緩解廣域網(wǎng)帶寬問題,存儲池位于電信公司的設(shè)施,并由專用鏈路連接到公有云。但是通向私有云的連接仍然速度偏慢,所以光纖到電信公司的連接依然是個問題。
不過,已經(jīng)有人提出了一個更發(fā)人深省的問題。云安全達到讓用戶相信它足夠安全可靠的時候――也許只要再過一兩年,公有云解決方案的靈活性、成本效益和絕對規(guī)模會讓混合云不切實際嗎?
除了這個問題外,現(xiàn)在一些人還在向公有云中的SaaS混搭應(yīng)用程序遷移。在某個時刻,純公有云解決方案很吸引人。從技術(shù)的角度來看,最合適的主機托管就是放在公有云提供商的內(nèi)部,而這有可能連接純公有云解決方案。
這種情況在今天還沒有出現(xiàn),但亞馬遜網(wǎng)絡(luò)服務(wù)公司(AWS)和谷歌可以在不泄露當(dāng)前銷售狀況的前提下,將其業(yè)務(wù)延伸到私有云領(lǐng)域,而微軟和VMware無法同樣輕松地做到這一點。從某種意義上來說,這正是美國中央情報局(CIA)與AWS的合作項目似乎所要做的。有人可能聽到CIO們都斷言根本不會出現(xiàn)這一幕,但主機托管模式已向這種可能性打開了潘多拉盒子。
原文標(biāo)題:Hybrid cloud storage challenges