DR Rapid:打通備份數(shù)據(jù)流動(dòng)的任督二脈
近日ESG發(fā)布了一份實(shí)驗(yàn)室報(bào)告《Dell DR Series Appliances with OS 3.2: Performance, Security, Scalability, and Interoperability Enhancements》,評(píng)測(cè)對(duì)象是軟硬件升級(jí)后的戴爾DR系列磁盤(pán)備份設(shè)備。
產(chǎn)品主要更新:➀針對(duì)新的和已有數(shù)據(jù)的靜態(tài)加密;
➁通過(guò)NDMP和iSCSI備份到虛擬磁帶庫(kù)(VTL),每個(gè)設(shè)備可以支持4個(gè)VTL容器;
➂性能升級(jí)。增加50%馬力(DR6000更新到Ivy Bridge處理器,現(xiàn)在是12核/CPU)縮小備份窗口并加速恢復(fù)同時(shí)支持加密任務(wù);
➃擴(kuò)展性改進(jìn)。DR6000現(xiàn)在支持在擴(kuò)展柜中的6TB磁盤(pán),提升RAID 6之后的總可用容量40%,從180TB達(dá)到252TB。這個(gè)可觀的密度——在10U機(jī)架中252TB——帶來(lái)了電源、制冷和管理方面的成本節(jié)約。
另外,配合DR2000v Hyperscale虛擬設(shè)備,最多3,000個(gè)DR2000v可以被授權(quán)到一個(gè)物理DR設(shè)備。
先重刪/壓縮,再加密這里需要解釋一點(diǎn),就是如果先對(duì)數(shù)據(jù)加密,再做重復(fù)數(shù)據(jù)刪除和壓縮就沒(méi)有效果了,無(wú)論你是定長(zhǎng)還是可變長(zhǎng)切塊,因?yàn)閿?shù)據(jù)中的規(guī)律在加密時(shí)完全被打亂。以傳統(tǒng)磁帶設(shè)備來(lái)說(shuō),壓縮和加密是不能同時(shí)做的。如果備份軟件做完重刪再將數(shù)據(jù)寫(xiě)到磁帶不是不可以,但通常這樣使用的不多,因?yàn)樵诨謴?fù)時(shí)需要相同的備份軟件環(huán)境、元數(shù)據(jù)和指紋庫(kù)。戴爾DR系列目標(biāo)設(shè)備是在備份寫(xiě)入時(shí)先做重刪和壓縮,再進(jìn)行加密;讀取時(shí)自然是先解密再“水化”復(fù)原數(shù)據(jù)。
戴爾DR系列的核心技術(shù),主要來(lái)自于2010年收購(gòu)Ocarina的壓縮和重復(fù)數(shù)據(jù)刪除技術(shù),也就是上圖中我們?nèi)Τ龅淖笊辖?mdash;—后來(lái)還增加了DR Rapid源端重刪加速技術(shù)(類似賽門(mén)鐵克OST和EMC DD Boost)。而右邊列出的“支持2.5億個(gè)文件”就屬于它文件系統(tǒng)的擴(kuò)展性了。性能影響測(cè)試
ESG通過(guò)測(cè)試來(lái)驗(yàn)證加密對(duì)性能的影響,首先是單純的目標(biāo)端重復(fù)數(shù)據(jù)刪除。除了CIFS和NFS兩種標(biāo)準(zhǔn)文件協(xié)議之外,RDA是戴爾專為DR系列和NetVault備份軟件通信而設(shè)計(jì)的專用協(xié)議,這里只用了Passthrough直通模式,沒(méi)有打開(kāi)其源端重刪。
可以看出,僅做目標(biāo)端重刪時(shí)打開(kāi)加密的性能影響是很小的。RDA協(xié)議的優(yōu)勢(shì)不小,我覺(jué)得它基本上可以替代傳統(tǒng)跑在FC網(wǎng)絡(luò)上的LAN-Free備份了。
上圖引用自ESG實(shí)驗(yàn)室在去年5月的另一份報(bào)告:《Enterprise-class Backup Performance with Dell DR6000》
戴爾DR Rapid技術(shù)的一大特點(diǎn)是開(kāi)放兼容。如上圖:除了所有DR支持(也就是做過(guò)兼容性測(cè)試)的備份應(yīng)用都可以使用標(biāo)準(zhǔn)NFS/CIFS做目標(biāo)端重刪之外;針對(duì)NetVault有自己的RDA;賽門(mén)鐵克Backup Exec和NetBackup可以用OST協(xié)議;對(duì)于CommVault、TSM、NetWorker、RMAN等更多備份程序還提供Rapid CIFS/Rapid NFS插件,同樣支持源端+目標(biāo)端全局重復(fù)數(shù)據(jù)刪除。
報(bào)告顯示:“全新協(xié)議加速器Rapid NFS和Rapid CIFS(屬于戴爾DR Rapid技術(shù)插件)是業(yè)內(nèi)首創(chuàng)的源端技術(shù)插件。經(jīng)測(cè)試,這些插件的備份處理性能可比傳統(tǒng)NFS/CIFS備份高三至五倍。”
在打開(kāi)源端重刪之后,加密對(duì)性能的影響在DR4100上相對(duì)明顯一些,但Rapid CIFS是個(gè)例外。ESG認(rèn)為DR6000硬件配置更高所以計(jì)算資源充足些。源端重刪將數(shù)據(jù)的Hash指紋計(jì)算和初步比對(duì)放在客戶主機(jī)或者備份服務(wù)器上完成(可參考下圖),而發(fā)送到DR設(shè)備后還要在全局指紋庫(kù)比對(duì),然后傳送唯一數(shù)據(jù)塊并壓縮,所以DR在加密之前的處理也是不少的。
與前面一個(gè)圖表比較,打開(kāi)源端重刪之后的備份吞吐性能基本在15-20TB/小時(shí)的水平,比單純目標(biāo)端重刪確實(shí)提升巨大。
DR Rapid參考架構(gòu)
上圖是DR Rapid源端重復(fù)數(shù)據(jù)刪除的一類部署方式。由于用的是NetWorker備份軟件,配合DR6000重刪的服務(wù)器安裝Rapid NFS/Rapid CIFS插件,只有控制元數(shù)據(jù)會(huì)發(fā)送到NetWorker備份服務(wù)器。
有的廠商在宣傳***性能數(shù)字時(shí),有意無(wú)意回避“DD Boost”這類技術(shù)帶有的源端重刪特征,在另外一些同行眼中那些數(shù)字則有“作弊”嫌疑。而我們則認(rèn)為應(yīng)該正視源端重刪技術(shù),運(yùn)行插件消耗一部分計(jì)算資源是客觀存在,但如果按常用的每天一次閑時(shí)備份,且服務(wù)器利用率允許的情況下也可以忽略這種影響。畢竟只要備份就可能有影響,何況源端重刪還能節(jié)省網(wǎng)絡(luò)帶寬,所以用戶根據(jù)自己實(shí)際情況來(lái)選擇就好了。還有一點(diǎn)可變因素就是測(cè)試的數(shù)據(jù)樣本,不同類型/重刪率的數(shù)據(jù)產(chǎn)生的加速效果也有不同。
如果不愿消耗生產(chǎn)服務(wù)器的資源,也可以將DR Rapid插件安裝在備份服務(wù)器上,配合DR系列進(jìn)行另外一種“源端”去重。這種情況下會(huì)增加備份服務(wù)器的壓力,客戶端到備份服務(wù)器的網(wǎng)絡(luò)流量不會(huì)減少,必要時(shí)可增加介質(zhì)服務(wù)器來(lái)提高并發(fā)。
上表是ESG去年報(bào)告里的測(cè)試結(jié)果,可以看出有些環(huán)境下Rapid NFS甚至能達(dá)到比RDA略高的性能,而OST和Rapid CIFS也相差不多。打開(kāi)源端重刪按照20TB/小時(shí)計(jì)算相當(dāng)于5.8GB/s,關(guān)閉源端重刪按照5TB/小時(shí)也有1.4GB/s。DR4100比DR6000的性能要低一些,但也能滿足大多數(shù)中小規(guī)模用戶的備份恢復(fù)需求了。
總之,我們認(rèn)為DR Rapid相對(duì)于同類技術(shù)的***特點(diǎn)就是開(kāi)放兼容、采用最便利的方法來(lái)與各種流行的備份軟件適配。當(dāng)您受困于備份/恢復(fù)速度,或者服務(wù)器與備份存儲(chǔ)之間的網(wǎng)絡(luò)瓶頸時(shí),不妨嘗試下戴爾DR系列來(lái)幫您打通這個(gè)數(shù)據(jù)流動(dòng)的“任督二脈”吧!