詳解Amazon Redshift
11月底,AWS推出了數(shù)據(jù)倉庫服務Redshift,除了價格便宜,Redshift還有諸多特點,甚至你根本不需要雇傭數(shù)據(jù)庫管理員。以下為James Hamilton對Redshift的評論:

快速 強大——Redshift有大量創(chuàng)新,提供非常高的數(shù)據(jù)請求性能,支持從幾百GB到PB或更多。首先,它采用列式存儲和壓縮技術(shù)。第二,硬件對數(shù)據(jù)倉庫進行優(yōu)化,使用附加的本地存儲和萬兆網(wǎng)卡連接每個節(jié)點。最后,使用了大規(guī)模并行處理(MPP)架構(gòu),可以在不停機的情況下實現(xiàn)擴展或收縮。
擴展性——有兩種節(jié)點類型可選,一種為特大節(jié)點(XL),擁有2TB的壓縮存儲空間,另一種為8倍特大節(jié)點(8XL),擁有16TB壓縮存儲空間。起初,你可以從1個特大節(jié)點起步,最大擴展到總共100個8倍特大節(jié)點的集群。特大節(jié)點集群可擁有1到32個節(jié)點,8倍特大集群可以擁有2到100個節(jié)點。
通過AWS管理控制臺或API,可以輕松的調(diào)整節(jié)點數(shù)量,并且這一過程不需要停機。目前Redshift處在有限預覽階段,并不支持調(diào)整重新設定空間,正式版將提供這一功能。
高性價比——你可以選擇按需付費或長期合同,或通過保留實例獲得更低的價格。在按需付費方式下,2TB的數(shù)據(jù)倉庫的價格為0.85美元/小時,價格節(jié)點數(shù)量隨擴展線性增長。保留實例的價格為0.228美元/小時,折合每年1000美元/TB。
全方位管理——Redshift對所有的設置、運維、擴展進行管理,貫穿數(shù)據(jù)倉庫從建立到集群備份,以及安裝補丁或升級。所有這些耗費精力的操作都交由Amazon來處理。
安全——Redshift支持SSL加密,可通過網(wǎng)頁界面對訪問數(shù)據(jù)倉庫網(wǎng)絡的防火墻進行設置,并支持在數(shù)據(jù)倉庫集群中創(chuàng)建用戶。當Redshift正式發(fā)布后,計劃支持靜止數(shù)據(jù)加密(encrypting data at rest)和Amazon虛擬私有云(Amazon VPC)。
可靠性——所有寫入節(jié)點的數(shù)據(jù),都將自動的在集群內(nèi)的節(jié)點進行備份,并不間斷的在S3進行備份。Redshift對集群的健康持續(xù)關(guān)注,并自動替換任何組件。
兼容性——Redshift通過了JasperSoft和Microstrategy認證,可以使用PostgreSQL JBDBC或ODBC將SQL客戶端或智能工具與Redshift數(shù)據(jù)倉庫連接。
寫在最后
毫無疑問,對于價格敏感的用戶,Redshift的吸引力足夠強大。但我還是會問許多問題?數(shù)據(jù)安全如何保證?S3僅能提供99.9%的可用性,與金融行業(yè)的標準相去甚遠。今年和去年頻發(fā)的宕機,讓許多AWS用戶心有余悸。有些充滿智慧的用戶摸索出一套跨可用區(qū)備份的經(jīng)驗,能大大提高可用性,但這需要幾年時間進行摸索、試錯和優(yōu)化。對于計劃嘗鮮Redshift的用戶,首先需要在本地保存好數(shù)據(jù),并準備一只強大的運維隊伍以及足夠的寬容心。