偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

學習筆記 Hadoop是什么?

開發(fā) 架構 Hadoop
Hadoop是什么,對于這個問題答案或許有不少人不知道,這里就像大家介紹一下什么是Hadoop,希望通過本文的介紹大家對Hadoop有清晰的認識。

本節(jié)和大家一起學習一下Hadoop,主要介紹一下Hadoop的概念以及它的特點,歡迎大家一起來學習Hadoop的知識。

1.Hadoop是什么
Hadoop原來是ApacheLucene下的一個子項目,它最初是從Nutch項目中分離出來的專門負責分布式存儲以及分布式運算的項目。簡單地說來,Hadoop是一個可以更容易開發(fā)和運行處理大規(guī)模數(shù)據(jù)的軟件平臺。

2.下面列舉hadoop主要的一些特點:

1擴容能力(Scalable):能可靠地(reliably)存儲和處理千兆字節(jié)(PB)數(shù)據(jù)。

2成本低(Economical):可以通過普通機器組成的服務器群來分發(fā)以及處理數(shù)據(jù)。這些服務器群總計可達數(shù)千個節(jié)點。

3高效率(Efficient):通過分發(fā)數(shù)據(jù),hadoop可以在數(shù)據(jù)所在的節(jié)點上并行地(parallel)處理它們,這使得處理非常的快速。

4可靠性(Reliable):hadoop能自動地維護數(shù)據(jù)的多份復制,并且在任務失敗后能自動地重新部署(redeploy)計算任務。

3.Hadoop實現(xiàn)了一個分布式文件系統(tǒng)(HadoopDistributedFileSystem),簡稱HDFS。

HDFS有著高容錯性(fault-tolerent)的特點,并且設計用來部署在低廉的(low-cost)硬件上。而且它提供高傳輸率(highthroughput)來訪問應用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(largedataset)的應用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以流的形式訪問(streamingaccess)文件系統(tǒng)中的數(shù)據(jù)。

4.Hadoop還實現(xiàn)了MapReduce分布式計算模型。

MapReduce將應用程序的工作分解成很多小的工作小塊(smallblocksofwork)。HDFS為了做到可靠性(reliability)創(chuàng)建了多份數(shù)據(jù)塊(datablocks)的復制(replicas),并將它們放置在服務器群的計算節(jié)點中(computenodes),MapReduce就可以在它們所在的節(jié)點上處理這些數(shù)據(jù)了。

如下圖所示:

5.HadoopAPI被分成(divideinto)如下幾種主要的包(package)

org.apache.hadoop.conf定義了系統(tǒng)參數(shù)的配置文件處理API。

org.apache.hadoop.fs定義了抽象的文件系統(tǒng)API。

org.apache.hadoop.dfsHadoop分布式文件系統(tǒng)(HDFS)模塊的實現(xiàn)。

org.apache.hadoop.io定義了通用的I/OAPI,用于針對網絡,數(shù)據(jù)庫,文件等數(shù)據(jù)對象做讀寫操作。

org.apache.hadoop.ipc用于網絡服務端和客戶端的工具,封裝了網絡異步I/O的基礎模塊。

org.apache.hadoop.mapredHadoop分布式計算系統(tǒng)(MapReduce)模塊的實現(xiàn),包括任務的分發(fā)調度等。

org.apache.hadoop.metrics定義了用于性能統(tǒng)計信息的API,主要用于mapred和dfs模塊。

org.apache.hadoop.record定義了針對記錄的I/OAPI類以及一個記錄描述語言翻譯器,用于簡化將記錄序列化成語言中性的格式(language-neutralmanner)。

org.apache.hadoop.tools定義了一些通用的工具。

org.apache.hadoop.util定義了一些公用的API。

【編輯推薦】

  1. Hadoop安裝部署簡明步驟詳解
  2. Hadoop執(zhí)行路徑深入剖析
  3. Hadoop集群與Hadoop性能優(yōu)化
  4. Hadoop 從Yahoo向Google的技術轉折
  5. Hadoop入門專家引導

 

 

責任編輯:佚名 來源: csdn.net
相關推薦

2011-08-30 16:26:34

Hadoop

2010-06-03 11:12:55

Hadoop

2012-07-03 16:56:12

Hadoop

2013-05-10 14:37:37

2010-06-04 18:17:50

Hadoop集群

2024-11-15 16:15:59

2019-08-09 16:01:18

Hadoop數(shù)據(jù)庫

2018-08-02 15:24:05

RPCJava微服務

2015-08-03 15:48:42

Hadoop大數(shù)據(jù)

2015-08-03 10:20:39

大數(shù)據(jù)Hadoop

2025-06-20 08:03:36

Hadoopmysql數(shù)據(jù)庫

2010-06-07 16:34:07

Hadoop0.20.

2009-06-15 09:00:39

2015-08-19 14:43:19

pighadoop

2021-08-12 10:35:15

模型優(yōu)化路線

2021-02-17 00:30:41

機器學習深度學習人工智能

2017-03-21 23:29:44

DevOps運維開發(fā)

2017-10-19 15:34:52

Hadoop技術機制學習

2018-09-30 15:55:56

2024-11-13 15:39:49

AIGCAI
點贊
收藏

51CTO技術棧公眾號