偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<meter id="hnehu"></meter>

<pre id="hnehu"><strike id="hnehu"></strike></pre>

<del id="hnehu"><ul id="hnehu"></ul></del>

<button id="hnehu"><option id="hnehu"></option></button>

<tfoot id="hnehu"><span id="hnehu"></span></tfoot>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

如何用Spark解決一些經(jīng)典MapReduce問(wèn)題？

作者：譚楊 2016-12-07 09:38:53

大數(shù)據(jù) Spark

本文將簡(jiǎn)單介紹幾個(gè)經(jīng)典hadoop的mr按理用spark實(shí)現(xiàn)，來(lái)讓大家熟悉spark的開發(fā)。

Spark是一個(gè)Apache項(xiàng)目，它被標(biāo)榜為“快如閃電的集群計(jì)算”。它擁有一個(gè)繁榮的開源社區(qū)，并且是目前最活躍的Apache項(xiàng)目。Spark提供了一個(gè)更快、更通用的數(shù)據(jù)處理平臺(tái)。和Hadoop相比，Spark可以讓你的程序在內(nèi)存中運(yùn)行時(shí)速度提升100倍，或者在磁盤上運(yùn)行時(shí)速度提升10倍。同時(shí)spark也讓傳統(tǒng)的map reduce job開發(fā)變得更加簡(jiǎn)單快捷。本文將簡(jiǎn)單介紹幾個(gè)經(jīng)典hadoop的mr按理用spark實(shí)現(xiàn)，來(lái)讓大家熟悉spark的開發(fā)。

***值最小值

求***值最小值一直是Hadoop的經(jīng)典案例，我們用Spark來(lái)實(shí)現(xiàn)一下，借此感受一下spark中mr的思想和實(shí)現(xiàn)方式。話不多說(shuō)直接上code：

預(yù)期結(jié)果：

max: 1001min: 2

思路和hadoop中的mr類似，設(shè)定一個(gè)key，value為需要求***與最小值的集合，然后再groupBykey聚合在一起處理。第二個(gè)方法就更簡(jiǎn)單，性能也更好。

平均值問(wèn)題

求每個(gè)key對(duì)應(yīng)的平均值是常見的案例，在spark中處理類似問(wèn)題常常會(huì)用到combineByKey這個(gè)函數(shù)，詳細(xì)介紹請(qǐng)google一下用法，下面看代碼：

我們讓每個(gè)partiton先求出單個(gè)partition內(nèi)各個(gè)key對(duì)應(yīng)的所有整數(shù)的和 sum以及個(gè)數(shù)count，然后返回一個(gè)pair(sum, count)在shuffle后累加各個(gè)key對(duì)應(yīng)的所有sum和count,再相除得到均值.

TopN問(wèn)題

Top n問(wèn)題同樣也是hadoop種體現(xiàn)mr思想的經(jīng)典案例,那么在spark中如何方便快捷的解決呢：

思路很簡(jiǎn)單，把數(shù)據(jù)groupBykey以后按key形成分組然后取每個(gè)分組***的2個(gè)。預(yù)期結(jié)果：

以上簡(jiǎn)單介紹了一下hadoop中常見的3個(gè)案例在spark中的實(shí)現(xiàn)。如果讀者們已經(jīng)接觸過(guò)或者寫過(guò)一些hadoop的mapreduce job，那么會(huì)不會(huì)覺(jué)得在spark中寫起來(lái)方便快捷很多呢。

責(zé)任編輯：武曉燕來(lái)源： 36大數(shù)據(jù)

Spark MapReduce

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)