偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Hadoop 2.0基本術(shù)語解釋

大數(shù)據(jù) Hadoop
在閱讀Hadoop 2.0的相關(guān)資料時,很多人將一些概念混淆了,本文將對Hadoop 2.0涉及到的術(shù)語進行比較全面的介紹。

(1) Hadoop 1.0

第一代Hadoop,由分布式存儲系統(tǒng)HDFS和分布式計算框架MapReduce組成,其中,HDFS由一個NameNode和多個DataNode組成,MapReduce由一個JobTracker和多個TaskTracker組成,對應(yīng)Hadoop版本為Hadoop 1.x和0.21.X,0.22.x。

(2) Hadoop 2.0

第二代Hadoop,為克服Hadoop 1.0中HDFS和MapReduce存在的各種問題而提出的。針對Hadoop 1.0中的單NameNode制約HDFS的擴展性問題,提出了HDFS Federation,它讓多個NameNode分管不同的目錄進而實現(xiàn)訪問隔離和橫向擴展;針對Hadoop 1.0中的MapReduce在擴展性和多框架支持方面的不足,提出了全新的資源管理框架YARN(Yet Another Resource Negotiator),它將JobTracker中的資源管理和作業(yè)控制功能分開,分別由組件ResourceManager和ApplicationMaster實現(xiàn),其中,ResourceManager負責(zé)所有應(yīng)用程序的資源分配,而ApplicationMaster僅負責(zé)管理一個應(yīng)用程序。對應(yīng)Hadoop版本為Hadoop 0.23.x和2.x。

(3) MapReduce 1.0或者MRv1(MapReduce version 1)

第一代MapReduce計算框架,它由兩部分組成:編程模型(programming model)和運行時環(huán)境(runtime environment)。它的基本編程模型是將問題抽象成Map和Reduce兩個階段,其中Map階段將輸入數(shù)據(jù)解析成key/value,迭代調(diào)用map()函數(shù)處理后,再以key/value的形式輸出到本地目錄,而Reduce階段則將key相同的value進行規(guī)約處理,并將最終結(jié)果寫到HDFS上。它的運行時環(huán)境由兩類服務(wù)組成:JobTracker和TaskTracker,其中,JobTracker負責(zé)資源管理和所有作業(yè)的控制,而TaskTracker負責(zé)接收來自JobTracker的命令并執(zhí)行它。

(4)MRv2(MapReduce version 2)

MapReduce 2.0或者MRv2具有與MRv1相同的編程模型,唯一不同的是運行時環(huán)境。MRv2是在MRv1基礎(chǔ)上經(jīng)加工之后,運行于資源管理框架YARN之上的MRv1,它不再由JobTracker和TaskTracker組成,而是變?yōu)橐粋€作業(yè)控制進程ApplicationMaster,且ApplicationMaster僅負責(zé)一個作業(yè)的管理,至于資源的管理,則由YARN完成。

簡而言之,MRv1是一個獨立的離線計算框架,而MRv2則是運行于YARN之上的MRv1。

(5) MapReduce 2.0或者YARN或者NextGen MapReduce

Hadoop 2.0中的資源管理框架,它是一個框架管理器,為各種框架進行資源分配和提供運行時環(huán)境。而MRv2則是運行在YARN之上的第一個計算框架,其他計算框架,比如Spark、Storm等,都正在往YARN上移植。YARN類似于幾年前的資源管理系統(tǒng)mesos和更早的Torque。

(6) HDFS Federation

Hadoop 2.0中對HDFS進行了改進,使NameNode可以橫向擴展成多個,其中,每個NameNode分管一部分目錄,這不僅增強了HDFS的擴展性,也使HDFS具備了隔離性。

【參考資料】

Cloudera blog:http://blog.cloudera.com/blog/2012/10/mr2-and-yarn-briefly-explained/

原文鏈接:http://dongxicheng.org/mapreduce-nextgen/hadoop-2-0-terms-explained/

【編輯推薦】

  1. 小白學(xué)數(shù)據(jù)分析:怎么做流失分析
  2. 小白學(xué)數(shù)據(jù)分析之K-means理論篇
  3. 小白學(xué)數(shù)據(jù)分析之從購買記錄分析道具支付環(huán)節(jié)
  4. 小白學(xué)數(shù)據(jù)分析之付費滲透率
  5. 小白學(xué)數(shù)據(jù)分析之Excel制作INFOGRAPHIC
責(zé)任編輯:彭凡 來源: 董的博客
相關(guān)推薦

2021-01-27 05:44:00

Consul術(shù)語命令

2011-10-10 14:30:22

刷機刷系統(tǒng)手機

2011-02-22 13:17:44

2010-06-07 13:02:46

Hadoop簡介

2018-11-01 08:58:28

物聯(lián)網(wǎng)術(shù)語IOT

2019-06-19 09:00:00

GitLinux開源

2010-09-13 13:27:25

CSS濾鏡

2014-02-12 14:12:29

2022-01-06 09:41:45

區(qū)塊鏈比特幣技術(shù)

2012-05-28 09:23:40

JavaHadoopApache

2009-06-12 08:54:22

EJB術(shù)語J2EE

2011-04-14 11:28:07

光纖

2012-03-19 10:41:15

JavaSocket

2009-02-04 09:11:52

Web2.0術(shù)語FTW

2017-03-22 20:21:16

Hadoop框架分布式

2009-04-14 09:35:33

.NETCLR術(shù)語

2020-05-13 16:54:05

JavaScript開發(fā)代碼

2013-05-28 09:12:59

Hadoop 2.0

2013-05-27 14:31:34

Hadoop 2.0

2023-09-14 07:07:31

敏感性專業(yè)術(shù)語視覺
點贊
收藏

51CTO技術(shù)棧公眾號