偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

解決大數(shù)據(jù)的開源工具

大數(shù)據(jù)
針對(duì)大數(shù)據(jù)的開源源代碼平臺(tái)變得十分流行。在過去的幾個(gè)月里, 似乎幾乎每個(gè)人都感覺到了影響。低成本、靈活性和適用于受過訓(xùn)練的人員是開源繁榮的主要原因。Hadoop、R和NoSQL是現(xiàn)在許多企業(yè)大數(shù)據(jù)策略的支柱,不管他們是否用它管理非結(jié)構(gòu)化數(shù)據(jù)或執(zhí)行復(fù)雜的統(tǒng)計(jì)分析?!?/div>

針對(duì)大數(shù)據(jù)的開源源代碼平臺(tái)變得十分流行。在過去的幾個(gè)月里, 似乎幾乎每個(gè)人都感覺到了影響。

低成本、靈活性和適用于受過訓(xùn)練的人員是開源繁榮的主要原因。Hadoop、R和NoSQL是現(xiàn)在許多企業(yè)大數(shù)據(jù)策略的支柱,不管他們是否用它管理非結(jié)構(gòu)化數(shù)據(jù)或執(zhí)行復(fù)雜的統(tǒng)計(jì)分析。”

幾乎難以跟上它:SAP AG最近發(fā)布了一個(gè)新的產(chǎn)品, SAP BusinessObjects預(yù)測(cè)分析,軟件整合了開源R語言的算法,該語言廣泛使用在針對(duì)高級(jí)統(tǒng)計(jì)模型的學(xué)術(shù)社區(qū)。

幾周之前, Teradata公司宣布其新的整合分析組合將包括R功能以及到GeoServer的一個(gè)連接,一個(gè)基于java的開源地理定位平臺(tái)。無數(shù)其他公司正急于建立鏈接到Hadoop。

廣泛的采用狂熱的創(chuàng)新

James Kobielus,曾任Forrester研究公司的分析師 (他現(xiàn)在IBM公司大數(shù)據(jù)分析解決方案產(chǎn)品營銷任高級(jí)項(xiàng)目主管),在一封電子郵件中這么寫道,“開源方法有最廣泛采用的勢(shì)頭和最狂熱的創(chuàng)新”。

但急什么?

首先, Kobielus解釋說,正如開源產(chǎn)品的范圍從Mozilla到 Android,在誕生的陣痛之后已經(jīng)在IT社區(qū)贏得廣泛的接受,開源數(shù)據(jù)存儲(chǔ)和分析軟件現(xiàn)在已經(jīng)成熟了(“不再是一兩年以前高風(fēng)險(xiǎn)的賭注”,正如他所說的那樣)。

其次, Kobielus寫道,像Hadoop, R和NoSQL這樣的平臺(tái)比專門的軟件享有優(yōu)勢(shì), 因?yàn)樗鼈兡芨斓匮葑?。他們也在不斷開發(fā)并為各種團(tuán)體所改進(jìn)。他預(yù)測(cè), 開源很快將會(huì)主宰大數(shù)據(jù)市場(chǎng)。

“隨著封閉式源碼軟件的足跡在很多數(shù)據(jù)/分析環(huán)境中的萎縮,許多現(xiàn)有的供應(yīng)商將朝著開源的方向發(fā)展他們的商業(yè)模式,”他寫道,“也會(huì)加大專業(yè)服務(wù)及系統(tǒng)整合以幫助客戶走向開源的、基于云的分析,其中大部分集中在Hadoop和R。

例如,F(xiàn)orrester把Hadoop看作是下一代企業(yè)數(shù)據(jù)倉庫 (EDW) 在云的核心,而把R看作是未來一波大數(shù)據(jù)開發(fā)工具主要的代碼庫。我們也期望各種開源NoSQL數(shù)據(jù)庫和工具聯(lián)合成為替代封閉內(nèi)容分析產(chǎn)品的豐富選擇。”

紅帽(Red Hat)模型

不同的企業(yè)以不同的方式接近開源整合。有些企業(yè),像SAP,選擇使用他們自己內(nèi)部的專家使用 Hadoop或R的功能開發(fā)產(chǎn)品,而其企業(yè),像Teradata移交了大量的工作給像革命分析公司(Revolution Analytics Inc.)這樣有些像紅帽公司的大數(shù)據(jù)公司。該公司面向企業(yè)提供一種商業(yè)版的R, 就像紅帽公司對(duì)Linux所做的那樣。

一家小公司站在大數(shù)據(jù)巨頭之間,這家公司專門為不同的業(yè)務(wù)流程的修改R,革命分析公司(Revolution Analytics)營銷和社區(qū)副總裁David Smith說, “尤其是, 我們讓它運(yùn)行在真正的大數(shù)據(jù)集上。”

在產(chǎn)品中使用開源是公司在市場(chǎng)中突出自己的一種方式, Smith說。“根據(jù)定義, 這意味著你不做競(jìng)爭對(duì)手在做的事。”

Smith說, 對(duì)于大數(shù)據(jù)分析采取先進(jìn)的、科學(xué)的態(tài)度的企業(yè),開源技術(shù)是一種自然的選擇。“那些公司有一點(diǎn)數(shù)據(jù)科學(xué)的文化,對(duì)數(shù)據(jù)有探索和好奇心,真的已經(jīng)被開源技術(shù)所吸引,因?yàn)樗鼈內(nèi)绱遂`活,并且向他們提供這些不同的方法思考數(shù)據(jù)并用這些數(shù)據(jù)探索不同的事情。”

革命分析的合作伙伴,Teradata實(shí)驗(yàn)室的總裁Scott Gnau說,大型企業(yè)將從開源技術(shù)的商業(yè)軟件套裝中受益最多,這樣他們能持續(xù)專注于他們的特定業(yè)務(wù)線。

“在采用一些新技術(shù)中有很多價(jià)值被創(chuàng)造,在Hadoop和MapReduce的環(huán)境中開發(fā),但將它們作為一種企業(yè)級(jí)的軟件,有可靠的版本控制,并有可靠的可擴(kuò)展性和有可得到的支持。

“它必須被打包并可靠地進(jìn)入主流,因?yàn)榇蠖鄶?shù)企業(yè)并不想集中去作軟件開發(fā)”他說。

EMC Greenplum的產(chǎn)品營銷經(jīng)理Will Davis表示贊同。他說, 規(guī)模較大的公司需要更穩(wěn)定、可靠的開源大數(shù)據(jù)平臺(tái)化身,不管他們是否添加了自己的改進(jìn)或依賴別人來幫他們做。

“很多企業(yè)…EMC的傳統(tǒng)客戶, 財(cái)富500強(qiáng)的之類的企業(yè), 真的需要該技術(shù)的部署適用于企業(yè), 以滿足嚴(yán)格的服務(wù)級(jí)合同(SLA) ,并總是在線可用的,”他說。

一些早期的開源技術(shù)采用者開發(fā)出專業(yè)知識(shí)單干,但“第二波”的公司渴望可以快速建立并運(yùn)行。 它們可能沒有自己員工來作做開發(fā)的工作。

引入數(shù)據(jù)科學(xué)家

目前對(duì)大數(shù)據(jù)人才確實(shí)是有巨大的需求,而且企業(yè)正意識(shí)到運(yùn)行開源平臺(tái)成為可以吸引到受過訓(xùn)練的的人才的最佳位置。開源技術(shù),尤其是R,被廣泛應(yīng)用于學(xué)術(shù)界。

此外,這些數(shù)據(jù)科學(xué)家能更好地利用開源平臺(tái)。Imran Ahmad是一個(gè)數(shù)據(jù)科學(xué)家,他已經(jīng)開發(fā)了自己的網(wǎng)格計(jì)算算法,稱為Bileg的Hadoop競(jìng)爭對(duì)手,它是基于開源的Globus 工具箱(GT4)的。多倫多一家為云環(huán)境開發(fā)數(shù)據(jù)分析技術(shù)的Cloudanum公司總裁說,開源平臺(tái)最根本的優(yōu)勢(shì)是,像他這樣的人能看到它根本的數(shù)學(xué)依據(jù)。

“如果在開源上,您可以向下挖掘并看到為什么我得到這些結(jié)果,為什么這些結(jié)果是最優(yōu)的,”Ahamad說。

專有數(shù)據(jù)分析軟件大多數(shù)時(shí)候能很好地工作,他補(bǔ)充道。但是當(dāng)一個(gè)“不尋常的場(chǎng)景”出現(xiàn)時(shí), 讓你無法信任你的結(jié)果。“它們將偏離你要找的東西,”他說。“這真是一種正可怕的情況”。

毫不意外,有統(tǒng)計(jì)建模背景的聰明才智也供不應(yīng)求,尤其是像如金融機(jī)構(gòu)這樣其它領(lǐng)域的機(jī)構(gòu)正在求賢若渴。

“他們已經(jīng)聘請(qǐng)了大批校外的人到數(shù)據(jù)科學(xué)部門或研發(fā)部門和建模部門,” Smith說,“而他們發(fā)現(xiàn)這些人都學(xué)習(xí)過R,而不是所說的SAS。”

所以毫不奇怪,有統(tǒng)計(jì)建模背景的聰明人才被求賢若渴,尤其當(dāng)像金融行業(yè)大量招聘他們的時(shí)候。

“我們提供Greenplum的咨詢業(yè)務(wù),”Davis說,“這是我們的數(shù)據(jù)科學(xué)團(tuán)隊(duì), 這些人是博士, 已經(jīng)是各種行業(yè)及其相關(guān)行業(yè)的專家。我有聰明而勤奮的人 ,坦白說, 這些人正與客戶一起讓他們的數(shù)據(jù)發(fā)揮作用。”

SAP集團(tuán)營銷經(jīng)理Jason Kuo說,需要執(zhí)行比如預(yù)測(cè)分析這樣復(fù)雜任務(wù)的公司無疑正在搜尋著高校的人才。他說, SAP的新產(chǎn)品組合了一個(gè)友好用戶界面和拖放功能,將易于數(shù)據(jù)科學(xué)家轉(zhuǎn)換角色到企業(yè)的世界里。

“這些人帶著他們的R專長, R的背景,并尋求和R相關(guān)的工具,”他說。“現(xiàn)在有趣的是,在學(xué)術(shù)環(huán)境中,不管出于什么原因,不管是它的廉價(jià)或者熟悉度,他們更有可能使用沒有GUI的 R,而不用圖形界面。而現(xiàn)在他們走進(jìn)企業(yè)的世界, 在那里他們的要求更高了, 項(xiàng)目轉(zhuǎn)變的框架更快, 也許正在追蹤投資回報(bào)率(ROI)等等。

“公司能說…你需要什么才能更成功? 我們?nèi)绾文苁鼓愀行? 和他們?yōu)檫@些統(tǒng)計(jì)師準(zhǔn)備了在過去不會(huì)有的預(yù)算。”

如果你不能戰(zhàn)勝他們

SAS研究公司平臺(tái)開發(fā)副總裁Paul Kent,為一家經(jīng)常被視為屬于大數(shù)據(jù)領(lǐng)域的對(duì)立面的公司工作,開發(fā)了專有數(shù)據(jù)分析算法替代那些用于像R這樣的開源語言。

Kens說, 在某種程度上, SAS并把開源社區(qū)作為一個(gè)并肩齊驅(qū)的競(jìng)爭者。新技術(shù)可以在開源環(huán)境中非常迅速地開發(fā),而他的公司在將技術(shù)轉(zhuǎn)化成適合市場(chǎng)的產(chǎn)品功能之前可能需要更多的時(shí)間來研究它們。

“我們需要更多一點(diǎn)時(shí)間對(duì)技術(shù)作出反應(yīng)并測(cè)試所有的不同角落和排列你可能使用它的方式。所以, 我們的響應(yīng)可能有點(diǎn)慢。

然而,他說,SAS在大型的技術(shù)支持市場(chǎng)有優(yōu)勢(shì),而且有使技術(shù)適用于不同機(jī)構(gòu)的專業(yè)知識(shí),無論是零售企業(yè)、銀行、或醫(yī)療機(jī)構(gòu)。SAS的優(yōu)勢(shì)在于“對(duì)特殊領(lǐng)域的數(shù)學(xué)應(yīng)用。”Kent說。

與此同時(shí),他說,SAS掌握趨勢(shì),并給它的客戶一樣的開源選項(xiàng)。Kent說SAS已經(jīng)“修建一座到R的橋梁”就像它對(duì)Hadoop所做的那樣。Kent表示,每當(dāng)開源社區(qū)有了好的創(chuàng)意,SAS都會(huì)關(guān)注。

“從長遠(yuǎn)看,搭建橋梁或界面到這樣的創(chuàng)意是有用的,勝過試圖假裝它不存在。”

原文鏈接:http://www.chinabi.net/Article/binews/201209/2227.html

 

責(zé)任編輯:林師授 來源: 中國商業(yè)智能網(wǎng)
相關(guān)推薦

2019-04-08 17:16:43

大數(shù)據(jù)開源工具

2016-09-27 21:35:28

BossiesSparkTensorFlow

2018-02-23 16:38:58

2012-07-04 11:47:39

大數(shù)據(jù)開源

2012-08-30 11:25:45

開源平臺(tái)谷歌Drill

2015-08-10 09:23:05

2018-06-05 12:06:20

Hadoop開源工具

2011-03-01 10:47:20

開源技術(shù)

2015-09-11 09:59:32

2017-07-20 16:40:36

大數(shù)據(jù)分析工具

2020-03-17 10:35:40

大數(shù)據(jù)IT人工智能

2015-08-10 10:37:42

2022-09-01 23:34:18

大數(shù)據(jù)數(shù)據(jù)分析工具

2022-08-31 17:01:56

大數(shù)據(jù)工具數(shù)據(jù)治理

2013-03-20 15:49:28

大數(shù)據(jù)

2013-05-07 14:56:27

大數(shù)據(jù)應(yīng)用工具數(shù)據(jù)中心網(wǎng)絡(luò)

2024-11-14 12:00:00

Python開源大數(shù)據(jù)

2020-04-08 16:41:18

大數(shù)據(jù)Hadoop工具

2013-08-14 09:48:02

微軟REEF

2019-11-06 15:01:30

大數(shù)據(jù)Hadoop技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)