偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<em id="tehyt"></em>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

數(shù)據(jù)太大？你該了解Hadoop分布式文件系統(tǒng)

作者：魯暢 2016-09-14 23:51:23

大數(shù)據(jù) 分布式 Hadoop

大數(shù)據(jù)時(shí)代來了。當(dāng)所有人都爭吵著這件事情的時(shí)候，當(dāng)所有企業(yè)都看好大數(shù)據(jù)的發(fā)展前景的時(shí)候，卻都很少關(guān)注這些數(shù)據(jù)從哪兒來，我們有沒有足夠優(yōu)秀的技術(shù)能力處理這些數(shù)據(jù)。

1、聯(lián)網(wǎng)設(shè)備增加數(shù)據(jù)量隨之上升

大數(shù)據(jù)時(shí)代來了。當(dāng)所有人都爭吵著這件事情的時(shí)候，當(dāng)所有企業(yè)都看好大數(shù)據(jù)的發(fā)展前景的時(shí)候，卻都很少關(guān)注這些數(shù)據(jù)從哪兒來，我們有沒有足夠優(yōu)秀的技術(shù)能力處理這些數(shù)據(jù)。

聯(lián)網(wǎng)設(shè)備增加數(shù)據(jù)量隨之上升

網(wǎng)絡(luò)的發(fā)展無疑為我們迎接大數(shù)據(jù)時(shí)代、智能計(jì)算時(shí)代鋪好了路。根據(jù)研究公司的預(yù)測，全球聯(lián)網(wǎng)設(shè)備正在增加，在部分國家，人均聯(lián)網(wǎng)設(shè)備早已超過2臺(tái);如此大量的聯(lián)網(wǎng)設(shè)備和不斷提高的網(wǎng)絡(luò)速度都在讓社會(huì)的數(shù)據(jù)量快速增長，智慧城市、平安城市的實(shí)現(xiàn)也是以視頻監(jiān)控等視頻數(shù)據(jù)為基礎(chǔ)，成為大數(shù)據(jù)時(shí)代的重要組成部分。

機(jī)器人、AI、機(jī)器學(xué)習(xí)的研究讓數(shù)據(jù)成為未來輔助我們生活的必要因素，無人車、機(jī)器人快遞等形式的出現(xiàn)，一方面體現(xiàn)了數(shù)據(jù)價(jià)值，另一方面也是在不斷收集數(shù)據(jù)，反哺數(shù)據(jù)分析和應(yīng)用。

數(shù)據(jù)體量太大誰來處理?

數(shù)據(jù)產(chǎn)生后，意味著數(shù)據(jù)的采集工作已經(jīng)完成，那么數(shù)據(jù)的輸入與有效輸出問題怎么破解?

自大數(shù)據(jù)時(shí)代到來之后，分布式存儲(chǔ)、大文件的讀寫都成為熱點(diǎn)話題，如何應(yīng)對(duì)越來越多的大文件存儲(chǔ)、分析與檢索，成為企業(yè)需要攻克的難題。

而Hadoop的原型要從2002年開始說起。Hadoop的雛形始于2002年的Apache的Nutch，Nutch是一個(gè)開源Java 實(shí)現(xiàn)的搜索引擎。而后根據(jù)谷歌發(fā)表的學(xué)術(shù)淪為谷歌文件系統(tǒng)(GFS)，實(shí)現(xiàn)了分布式文件存儲(chǔ)系統(tǒng)名為NDFS。而后又根據(jù)Google發(fā)表的一篇技術(shù)學(xué)術(shù)論文MapReduce，在Nutch搜索引擎實(shí)現(xiàn)了用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行分析運(yùn)算。***，雅虎雇用了Doug Cutting，Doug Cutting將NDFS和MapReduce升級(jí)命名為Hadoop，HDFS(Hadoop Distributed File System，Hadoop分布式文件系統(tǒng))就此形成。

應(yīng)該說Hadoop是針對(duì)大數(shù)據(jù)而存在的，HDFS能夠提供高吞吐量的數(shù)據(jù)訪問，適合有著超大規(guī)模數(shù)據(jù)集的應(yīng)用程序。我們可以在Hadoop的設(shè)計(jì)中看到三大特點(diǎn)：適用于存儲(chǔ)超大文件、適合運(yùn)行在普通廉價(jià)的服務(wù)器上，同時(shí)，最搞笑的訪問模式是一次寫入、多次讀取。

當(dāng)然，HDFS也存在一些弊端，比如說不適用于有低延遲要求的應(yīng)用場景。因?yàn)镠adoop是針對(duì)大數(shù)據(jù)傳輸?shù)拇嬖冢菫楦邤?shù)據(jù)吞吐量應(yīng)用而設(shè)計(jì)，這導(dǎo)致其必然要以高延遲作為代價(jià)。同時(shí)HDFS分布式存儲(chǔ)不適用于小文件傳輸，在大量小文件傳輸過程中，namenode的內(nèi)存就吃不消了。

2、Hadoop概念科普

Hadoop概念科普

在了解了Hadoop的身世和現(xiàn)在適合的應(yīng)用場景之后，筆者要跟大家科普一下Hadoop的基礎(chǔ)架構(gòu)和主要概念。

NameNode：namenode負(fù)責(zé)管理文件目錄、文件和block的對(duì)應(yīng)關(guān)系以及block和datanode的對(duì)應(yīng)關(guān)系。這是由唯一一臺(tái)主機(jī)專門保存，當(dāng)然這臺(tái)主機(jī)如果出錯(cuò)，NameNode就失效了，需要啟動(dòng)備用主機(jī)運(yùn)行NameNode。

DataNode：負(fù)責(zé)存儲(chǔ)，當(dāng)然大部分容錯(cuò)機(jī)制都是在datanode上實(shí)現(xiàn)的。分布在廉價(jià)的計(jì)算機(jī)上，用于存儲(chǔ)Block塊文件。

MapReduce：通俗說MapReduce是一套從海量·源數(shù)據(jù)提取分析元素***返回結(jié)果集的編程模型，將文件分布式存儲(chǔ)到硬盤是***步，而從海量數(shù)據(jù)中提取分析我們需要的內(nèi)容就是MapReduce做的事了。

Block：也叫作數(shù)據(jù)塊，默認(rèn)大小為64MB。每一個(gè)block會(huì)在多個(gè)datanode上存儲(chǔ)多份副本，默認(rèn)是3份。

Rack：機(jī)柜，一個(gè)block的三個(gè)副本通常會(huì)保存到兩個(gè)或者兩個(gè)以上的機(jī)柜中。

責(zé)任編輯：趙寧寧來源：中關(guān)村在線

大數(shù)據(jù)Hadoop

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營