偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Twitter將采用Spark分析大數(shù)據(jù)

大數(shù)據(jù) Spark
Twitter數(shù)據(jù)科學(xué)家Edwin Chen最近在接受媒體采訪的時(shí)候透露,Twitter內(nèi)部希望嘗試一種全新的大數(shù)據(jù)系統(tǒng)——Spark。

 Spark是一個(gè)基于內(nèi)存計(jì)算的開源的集群計(jì)算系統(tǒng)(點(diǎn)此下載),目的是讓數(shù)據(jù)分析更加快速。Spark非常小巧玲瓏,由加州伯克利大學(xué)AMP實(shí)驗(yàn)室的Matei為主的小團(tuán)隊(duì)所開發(fā)。使用的語言是Scala,項(xiàng)目的core部分的代碼只有63個(gè)Scala文件,非常短小精悍。與Hadoop不同的是,Spark和Scala緊密集成,Scala像管理本地collective對(duì)象那樣管理分布式數(shù)據(jù)集。

Edwin認(rèn)為:”MapReduce或hadoop任務(wù)都是批處理,所以啟動(dòng)一項(xiàng)Hadoop任務(wù),或等待結(jié)果返回都需要等待很長時(shí)間,這一點(diǎn)很難改變,因?yàn)镠adoop天生就是一個(gè)批處理系統(tǒng),你無法在上面運(yùn)行互動(dòng)分析。不過Hadoop對(duì)于分析海量數(shù)據(jù)還是很有用的。”

Spark開發(fā)之初是為了兩個(gè)能被內(nèi)存計(jì)算提速的應(yīng)用:互動(dòng)算法(常見于機(jī)器學(xué)習(xí)中,例如Google的PR)和互動(dòng)數(shù)據(jù)挖掘(Hive on Spark)。在這兩個(gè)應(yīng)用中,Spark的速度是Hadoop MapReduce的30倍!這是因?yàn)檫\(yùn)行Spark系統(tǒng)時(shí),服務(wù)器可以把中間數(shù)據(jù)存儲(chǔ)在RAM內(nèi)存中,而無需經(jīng)常從頭加載。這意味著分析結(jié)果的返回速度大大加快,足以勝任互動(dòng)分析工作。(見下圖)

spark-lr

在Spark的出生地——加州伯克利大學(xué)的AMP實(shí)驗(yàn)室,研究人員用Spark分析垃圾郵件過濾、自然語言處理以及交通路況預(yù)測(cè)等任務(wù)。Spark還被用來給Conviva、Klout和Quantifind等公司的數(shù)據(jù)分析服務(wù)提速。無疑,Spark處理分布式數(shù)據(jù)集的框架不僅是有效的,而且是高效的(通過簡(jiǎn)潔的Scala腳本)。Spark和Scala目前都還尚處于開發(fā)中。盡管如此,隨著加入更多的關(guān)鍵互聯(lián)網(wǎng)特性,它越來越從有趣的開源軟件過渡為基礎(chǔ)的web技術(shù)。

責(zé)任編輯:彭凡 來源: IT經(jīng)理世界
相關(guān)推薦

2013-05-14 10:01:57

Luchy Sort

2013-05-14 09:17:14

Twitter大數(shù)據(jù)Lucky Sort

2020-03-24 15:16:09

Salesforce大數(shù)據(jù)Einstein An

2017-11-06 14:48:01

大數(shù)據(jù)法醫(yī)犯罪

2017-10-19 08:28:15

大數(shù)據(jù)HadoopSpark

2012-12-06 10:59:51

大數(shù)據(jù)

2013-08-01 09:09:39

大數(shù)據(jù)

2013-04-19 14:28:07

大數(shù)據(jù)

2017-10-11 11:10:02

Spark Strea大數(shù)據(jù)流式處理

2023-06-05 05:39:35

大數(shù)據(jù)

2009-03-03 11:31:21

Twintter集成搜索

2014-05-27 16:23:46

Twitter開放數(shù)據(jù)

2018-04-17 09:03:01

SparkRDD大數(shù)據(jù)

2013-05-09 09:35:00

Cloudmeter大數(shù)據(jù)

2014-03-27 09:36:36

Spark

2022-04-02 09:32:06

大數(shù)據(jù)數(shù)據(jù)智能企業(yè)

2020-06-23 14:12:23

大數(shù)據(jù)IT技術(shù)

2020-12-24 15:00:50

物聯(lián)網(wǎng)大數(shù)據(jù)數(shù)據(jù)分析

2021-03-15 14:02:21

大數(shù)據(jù)數(shù)據(jù)開發(fā)Spark

2013-01-10 12:54:29

大數(shù)據(jù)探討Twitter
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)