四大云端大數(shù)據(jù)平臺評測分析
當(dāng)你已經(jīng)準(zhǔn)備好實(shí)施大數(shù)據(jù),請仔細(xì)的評估云提供商提供的大數(shù)據(jù)功能,確保找到最合適的。下面我們來看一下四種云服務(wù)產(chǎn)品。
當(dāng)談到在云端實(shí)施大數(shù)據(jù)戰(zhàn)略時,好消息是你會有很多選擇。但是,這同時也是一個壞消息。來自Forrester Research最近的一份報告強(qiáng)調(diào),盡管大數(shù)據(jù)云服務(wù)很強(qiáng)大,他們也有可能造成混亂,從而需要企業(yè)采用比傳統(tǒng)的方式更加靈活,瑣碎的方法。該報告的結(jié)論是:在云計算領(lǐng)域中沒有一種服務(wù)是適合所有狀況的。
***的三家公有云平臺—亞馬遜Web服務(wù)(AWS)、微軟的Azure和Google--提供了范圍廣泛的大數(shù)據(jù)服務(wù),但每一種服務(wù)又完全不同。由于每個公司的大數(shù)據(jù)需求不同,技能集也不同,評估所有的平臺來確保你獲得的是正確組合的服務(wù)非常重要,Kirk Borne,喬治梅森大學(xué)的數(shù)據(jù)科學(xué)家,天文物理和計算科學(xué)教授同時也是一位知名的大數(shù)據(jù)專家這樣建議道。
“任何大數(shù)據(jù)的實(shí)施都必須從你試圖解決的問題開始,”Borne說。“你需要在花大把資金之前先了解企業(yè)的情況,確保你從可用的服務(wù)中選擇正確的那個。”
下面來看下這三大主流云平臺提供的大數(shù)據(jù)產(chǎn)品,以及第四家Altiscale,這是一家比較新的公司,有自己的Hadoop云平臺。
AWS:選擇和機(jī)遇
在每一項(xiàng)遷移到云的決策中,一個平臺的“生態(tài)系統(tǒng)”,即服務(wù)、合作伙伴、專家和系統(tǒng)集成師扮演了重要的角色。根據(jù)Ouoble,一家在 AWS,Google和Azure平臺提供大數(shù)據(jù)即服務(wù)公司的聯(lián)合創(chuàng)始人兼CEO Ashish Thusoo的觀點(diǎn),AWS的生態(tài)系統(tǒng)要比其他的云平臺更大、發(fā)展得更好。AWS生態(tài)系統(tǒng)使得這個平臺對于想要將大數(shù)據(jù)遷移到云中的企業(yè)客戶來說非常引人注目和令人感到安心,他說。
這種吸引力的一部分原因是因?yàn)楦鞣N可用的服務(wù)。亞馬遜的一整套大數(shù)據(jù)服務(wù)包括了Hadoop的彈性MapReduce即EMR;用作數(shù)據(jù)流處理的 Kinesis;基于集群的數(shù)據(jù)倉庫RedShift;面向亞馬遜關(guān)系型數(shù)據(jù)庫RDS的Aurora和My SQL(等其他);NoSQL數(shù)據(jù)庫DynamoDB;超簡單存儲或者S3;還有全新的Amazon Machine Learning。
“AWS能夠提供過去的歷史報表和儀表盤,現(xiàn)有的數(shù)據(jù)流處理和分析,和現(xiàn)在未來預(yù)測的建模工具,”Mike Gualtieri,一名Forrester Research的分析師,F(xiàn)orrester大數(shù)據(jù)研究報告合著者說。他認(rèn)為AWS的RedShift對那些已經(jīng)厭倦了很慢的傳統(tǒng)數(shù)據(jù)庫環(huán)境中的報表的企業(yè)客戶來說尤其誘人。“RedShift是AWS服務(wù)中發(fā)展最快的,將你的數(shù)據(jù)遷移到那里運(yùn)行所有的分析非常合理,”他說。“這真的是一種云的合理使用方式。”
Google BigQuery:開發(fā)者之夢
Google的大數(shù)據(jù)平臺BigQuery,是為流數(shù)據(jù)和持續(xù)分析而設(shè)計的。該平臺有一個預(yù)測性的數(shù)據(jù)API,一些其它的Google專屬API和標(biāo)準(zhǔn)的 Java產(chǎn)品。“關(guān)于Google的問題是它是非常面向開發(fā)人員的,比其他平臺更加如此,”Gualtieri說。“在Google,你必須接受他們專有的技術(shù)和API,并且足夠聰明到可以搞清楚。”Google平臺提供了Hadoop作為一個大數(shù)據(jù)的選項(xiàng),但是Gualtieri提醒公司企業(yè)如果想在 Google上運(yùn)行Hadoop的話需要具備企業(yè)內(nèi)部的專業(yè)技能。“它就在那里,但你***自己要知道如何獲得,具體到命令行的級別,”他說。
但對于某些公司,Ouoble的Thusoo說,Google則是最***的選擇,尤其當(dāng)價格和性能決定一切的時候。“我們對Google在價格和性能上做了基準(zhǔn)測試,Google在這塊絕對是佼佼者,”他說,“性價比通常對創(chuàng)業(yè)公司非常重要,因此谷歌是他們的***選擇。”
Azure:Hadoop之力
Azure平臺的大數(shù)據(jù)產(chǎn)品HDInsight,和SQL數(shù)據(jù)庫以及存儲一起,旨在能夠同微軟流行的Excel電子表格無縫工作。這對于客戶來說是一個巨大的賣點(diǎn),因?yàn)楦鶕?jù)Forrester的報告表明,在大數(shù)據(jù)所在的地方處理大數(shù)據(jù)(也叫數(shù)據(jù)重力)會讓整個過程更輕松。“我真的認(rèn)為Azure在混合領(lǐng)域里有其優(yōu)勢,”Thusoo說,“很大部分是因?yàn)槲④浛梢岳米约罕镜貞?yīng)用的影響力。”
HDInsight是由Apache的Hadoop支持的,這也是一大吸引力,F(xiàn)orrester的Gualtieri說。“微軟有許多不同的工具,包括機(jī)器學(xué)習(xí)和預(yù)測分析,”他說。“而對于任何想要用Hadoop做大數(shù)據(jù)分析的人來說,Azure是一個非常好的選擇,因?yàn)樗苋菀撰@得并且具有強(qiáng)大的控制面板。”
Altiscale:一直都是大數(shù)據(jù)
成立3年的Altiscale最開始是在自己的云里推出Hadoop即服務(wù)。這家公司的創(chuàng)始人,Raymie Stata,在創(chuàng)建Altiscale之前曾是雅虎的CTO并且為這家網(wǎng)絡(luò)巨頭開發(fā)了Hadoop即服務(wù)。“Altiscale的設(shè)計從本質(zhì)上是***的,”Altiscale的COO Mike Maciag解釋道。用戶可以從三大云服務(wù)供應(yīng)商獲得“通用的”大數(shù)據(jù)服務(wù),但Altiscale的云是從硬件以上都進(jìn)行了定制可以更高效地運(yùn)行大數(shù)據(jù),Maciag說。“大型云供應(yīng)商為很多的縱向處理提供了良好的計算密集型的功能,但大數(shù)據(jù)更多的是大規(guī)模并行處理,這意味著它是橫向的。 Altiscape是專為Hadoop構(gòu)建的來避免吵鬧鄰居的問題。”
原文鏈接:http://www.searchcloudcomputing.com.cn/showcontent_89287.htm






















