偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

信息時(shí)代 大數(shù)據(jù)有用開源工具

開源
這是個(gè)信息“泛濫”的時(shí)代,大數(shù)據(jù)量司空見慣,企業(yè)處理大數(shù)據(jù)的需求也越來越大。首先,關(guān)系型數(shù)據(jù)庫和桌面分析或者虛擬化包不能處理大數(shù)據(jù),相反,運(yùn)行在數(shù)千臺(tái)服務(wù)器上的大量并行軟件需要做這個(gè)工作。

這是個(gè)信息“泛濫”的時(shí)代,大數(shù)據(jù)量司空見慣,企業(yè)處理大數(shù)據(jù)的需求也越來越大。本文梳理一下“大數(shù)據(jù)”的解決方案。

 

首先,關(guān)系型數(shù)據(jù)庫和桌面分析或者虛擬化包不能處理大數(shù)據(jù),相反,運(yùn)行在數(shù)千臺(tái)服務(wù)器上的大量并行軟件需要做這個(gè)工作。許多機(jī)構(gòu)轉(zhuǎn)向開源工具,比如Apache的 Hadoop來處理大數(shù)據(jù)。比如Twitter發(fā)送登陸信息到Hadoop,并直接寫入HDFS,Hadoop文件系統(tǒng)。

Hadoop支持?jǐn)?shù)據(jù)密集的應(yīng)用部署在數(shù)千節(jié)點(diǎn)和數(shù)個(gè)PB, David Hill, Mesabi Group 主席表示。但是,大數(shù)據(jù)在針對不同類型的應(yīng)用時(shí),確不能一概而論。比如Hadoop并不一定適合所有的案例,Hill警告說。

大數(shù)據(jù)的捕捉、存儲(chǔ)、分析,依靠特殊的應(yīng)用的特性,Hill強(qiáng)調(diào)。舉例scale-out網(wǎng)絡(luò)連接的存儲(chǔ)EMC Isilon或IBM的SONAS,可能對于使用非結(jié)構(gòu)化的數(shù)據(jù)比如圖片、視頻,會(huì)更好。

大數(shù)據(jù)處理的類型

大數(shù)據(jù)的處理,可以歸為3個(gè)基本類型,Revolution Analytics的執(zhí)行副總Mike Minelli表示,信息管理、商業(yè)智能,以及智能分析。信息管理捕捉和存儲(chǔ)信息,BI分析數(shù)據(jù),看過去發(fā)生的情況,智能分析則是對于數(shù)據(jù)的預(yù)測。Minelli說。

Revolution analytics提供開源R語言和 Revolution R Enterprise,提供TB量級數(shù)據(jù)的高級分析。Revolution Analytics正在開發(fā)Hadoop連接器和R語言在Google的Map/Reduce框架上的能力。

處理大數(shù)據(jù)的工具

提供了處理大數(shù)據(jù)分析能力的專有軟件包括 AsterData;IBM的專有軟件Netezza ; Datameer, 建立在Apache的Hadoop上的專有軟件,以及Paraccel。IBM的Netezza,在它的InfoSphere產(chǎn)品中。Oracle 的Exadata,,以及EMC的Greenplum也是處理大數(shù)據(jù)量的專有工具。

EMC引入了Greenplum數(shù)據(jù)庫的免費(fèi)社區(qū)版本,該社區(qū)版本只是軟件。Greenplum社區(qū)報(bào)表包括3個(gè)協(xié)作模塊Greenplum DB, MADlib, 和Alpine Miner。處理大數(shù)據(jù)量的開源工具包括Hadoop、Map/Reduce,以及Jaspersoft 的BI工具。

Jaspersoft提供的BI工具,提供了報(bào)告、分析、ETLETL (解壓、轉(zhuǎn)換、加載) ,針對大量的并行分析數(shù)據(jù)庫,包括EMC Greenplum和HP Vertica。Jaspersoft也提供本地報(bào)告,通過Hadoop和各種類型的NoSQL數(shù)據(jù)庫包括MongoDB, Riak, CouchDB and Infinispan的開源連接。

開源工具VS專有工具

開源工具可以查看代碼,這樣開發(fā)者可以找到他們整合時(shí)里面是什么。在幾乎所有的案例中,開源分析都更具性價(jià)比和靈活性。Revolution Analytics的Minelli表示。

數(shù)據(jù)量在持續(xù)的增長,公司將被迫增加基礎(chǔ)設(shè)施的部署。專利費(fèi)用將一直增加,而開源技術(shù),則省了這筆一直持續(xù)的專利費(fèi)。Twitter選擇Hadoop,其中重要的原因是專有工具的費(fèi)用太高。

更長遠(yuǎn)的來看,開源工具使企業(yè)創(chuàng)建新的分析技術(shù),更好的處理非結(jié)構(gòu)化的語言,比如圖片等。而不能寄托于傳統(tǒng)廠商發(fā)展新的分析技術(shù)。開源工具給了企業(yè)創(chuàng)新的機(jī)會(huì)。

另外一個(gè)領(lǐng)域就是開源與專有工具的混合使用。

短期來講,開源分析將越來越廣泛的使用,并且增長迅速。長期來看,混合技術(shù)的應(yīng)用將在高度競爭的市場上出現(xiàn),兩者將同樣有巨大的需求。

【編輯推薦】

  1. 天涯運(yùn)維:如何給企業(yè)選擇適合的開源技術(shù)構(gòu)架
  2. 回眸:開源技術(shù)歷史中的九個(gè)重大事件
  3. 視點(diǎn):Ubuntu 10.04如何進(jìn)行開源技術(shù)的商業(yè)化
  4. 帶你探尋開源技術(shù)中的五大開源協(xié)議
責(zé)任編輯:張浩 來源: Linuxeden
相關(guān)推薦

2013-11-29 13:31:52

隱私數(shù)據(jù)安全

2011-05-20 09:10:26

制造業(yè)綠色I(xiàn)T用友

2018-05-21 20:58:44

人工智能云服務(wù)企業(yè)

2016-01-11 17:02:37

暢享網(wǎng)

2016-10-09 13:45:29

信息資本市場大數(shù)據(jù)

2012-04-01 14:57:46

2013-10-31 11:40:43

2012-03-31 15:54:35

戴爾戴爾咨詢

2018-06-04 21:47:01

2013-11-11 18:19:44

信息時(shí)代知識(shí)工程

2013-04-15 11:41:40

信息安全大數(shù)據(jù)大數(shù)據(jù)全球技術(shù)峰會(huì)

2019-04-08 17:16:43

大數(shù)據(jù)開源工具

2012-09-13 09:52:14

大數(shù)據(jù)數(shù)據(jù)應(yīng)用開源工具

2022-03-22 22:49:57

大數(shù)據(jù)信息安全安全

2016-09-13 22:23:52

2015-06-02 11:29:50

信息安全數(shù)據(jù)安全

2021-08-16 13:53:58

大數(shù)據(jù)安全信息

2016-09-27 21:35:28

BossiesSparkTensorFlow

2009-10-29 10:27:21

2020-10-28 15:06:12

大數(shù)據(jù)科技技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號