偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Hadoop架構(gòu)已凋謝嗎 ?

大數(shù)據(jù) Hadoop
坦率地說,Hadoop走下坡路似乎找不到一個最根本的理由。相反,Hadoop架構(gòu)人氣下滑可能歸咎于幾個不同的因素。一些IT專業(yè)人員對于自己無法在Hadoop集群上執(zhí)行任何有意義的數(shù)據(jù)分析頗為沮喪。

Hadoop架構(gòu)的人氣在下滑,這可能歸咎于幾個不同的因素,尤其是機器學習的興起。

過去這幾年,HDFS的使用量一直在下降,這種基于Java的文件系統(tǒng)已幾乎成為所謂的大數(shù)據(jù)革命的代名詞。這主要歸因于市場對Hadoop普遍缺乏興趣。但是導致Hadoop被大規(guī)模拋棄的Hadoop架構(gòu)方面又如何呢?要知道,就在不久前Hadoop還大有希望。

Hadoop架構(gòu)已凋謝嗎 ?

坦率地說,Hadoop走下坡路似乎找不到一個最根本的理由。相反,Hadoop架構(gòu)人氣下滑可能歸咎于幾個不同的因素。

一些IT專業(yè)人員對于自己無法在Hadoop集群上執(zhí)行任何有意義的數(shù)據(jù)分析頗為沮喪。一種常見的觀點是,Hadoop非常適合存儲大量數(shù)據(jù),但是對于需要最終用戶可以直接處理這些數(shù)據(jù)的那些企業(yè)來說,它又往往不是最佳解決方案。

幾家供應商已經(jīng)開發(fā)了SQL on Hadoop解決方案,讓客戶可以針對駐留在Hadoop上的數(shù)據(jù)運行SQL查詢。即便如此,這些工具也不是天生一模一樣,每家SQL on Hadoop供應商都似乎為特定的使用場合設(shè)計其工具。不難想象眾多企業(yè)組織痛苦地發(fā)現(xiàn):它們購買的SQL on Hadoop引擎其實并不是很適合自己的大數(shù)據(jù)項目。

不僅僅是很難讓Hadoop完成企業(yè)組織需要它完成的任務(wù)這個因素導致Hadoop的使用量減少。導致Hadoop日漸式微的偶爾提到的另一個原因是,Hadoop與目前的IT趨勢不相合拍。

大數(shù)據(jù)革命似乎在一夜之間就立穩(wěn)了腳跟;大數(shù)據(jù)蔚然成風時,Hadoop完全準備好了響應號召。畢竟,據(jù)Hortonworks聲稱,HDFS文件系統(tǒng)“已表明了它具有在生產(chǎn)環(huán)境下支持200 PB存儲的可擴展性”,而4500臺服務(wù)器組成的單單一個集群就能支持“近10億個文件和塊”。很顯然,HDFS處理得了大數(shù)據(jù)。

可問題是,大數(shù)據(jù)潮流似乎已翻篇了。盡管IT部門仍然在搞可能歸屬大數(shù)據(jù)這個大類的項目,但這個術(shù)語用得越來越少。相反,當下的IT潮流似乎是機器學習;當然,Hadoop并不直接支持機器學習。市面上有一些第三方工具(比如Apache Mahout)能夠做到讓Hadoop支持機器學習,但可能數(shù)量太少、動作太晚。

然而,Hadoop使用量下降的最大原因可能是亞馬遜AWS和微軟Azure等IaaS云日漸成熟。公共云對于企業(yè)組織遠離Hadoop起到了重要的作用,這出于幾個不同的原因。

第一個原因是純粹的感知或看法。我們生活在一個云優(yōu)先的世界。公共云提供商在說服人們相信在云端運行工作負載比在本地運行同樣那些工作負載要省錢得多這方面做得很到位。

另外,外頭往往認為繼續(xù)在本地環(huán)境部署新工作負載的企業(yè)多少落后于時代。

公共云提供商慢慢促使Hadoop衰落的第二個原因是,云提供商實際上構(gòu)建了一個更管用的捕鼠器。雖然值得一提的是,亞馬遜確實通過亞馬遜EMR支持Hadoop和Spark,但對于需要大數(shù)據(jù)分析功能的企業(yè)組織而言,EMR并非亞馬遜的唯一解決方案。亞馬遜還提供Athena和Elasticsearch,前者可用于分析存儲在亞馬遜S3中PB級的數(shù)據(jù),后者支持PB級的日志分析、文本搜索和應用程序監(jiān)控功能。

我料想,Hadoop和HDFS文件系統(tǒng)根本不會完全消失,至少在短期內(nèi)不會消失。我認為,將來可能總是需要使用商用硬件的大容量存儲。此外,將大量數(shù)據(jù)上傳到公共云可能成本過高,還可能帶來購置、維護和運輸?shù)缺U戏矫娴膯栴}。

話雖如此,新的大數(shù)據(jù)項目誕生于云端顯得越來越常見,IT專業(yè)人員日益發(fā)現(xiàn)云原生大數(shù)據(jù)工具比Hadoop來得更易于使用、更有效。

作者:Brien Posey是Relevant Technologies主管研究開發(fā)的副總裁,為多家刊物和網(wǎng)站撰寫技術(shù)文章。

責任編輯:未麗燕 來源: 互聯(lián)網(wǎng)架構(gòu)師
相關(guān)推薦

2019-10-11 08:58:21

Hadoop開源

2019-06-25 11:03:20

HadoopGoogleSpark

2019-11-06 08:54:21

HDFSHadoopMapReduce

2021-11-02 09:50:37

MPPHadoop架構(gòu)

2023-01-06 11:08:51

MPP架構(gòu)Hadoop

2012-09-21 09:49:37

HadoopHDFS

2012-06-26 15:13:50

Hadoop數(shù)據(jù)架構(gòu)

2023-11-15 15:37:21

大模型人工智能

2016-06-01 15:42:58

Hadoop數(shù)據(jù)管理分布式

2017-11-13 13:39:24

SparkHadoop大數(shù)據(jù)

2015-07-29 10:36:05

hadoop數(shù)據(jù)挖掘

2018-12-27 12:34:42

HadoopHDFS分布式系統(tǒng)

2019-07-17 13:25:03

SparkHadoop架構(gòu)

2018-04-02 10:28:10

iOSPWA蘋果

2015-04-24 11:20:15

Hadoop大數(shù)據(jù)架構(gòu)大數(shù)據(jù)

2012-07-11 17:21:23

HadoopHDFS

2012-06-05 08:59:35

Hadoop架構(gòu)服務(wù)器

2013-01-29 10:20:06

MapReduceHadoop架構(gòu)

2015-04-29 17:40:53

企業(yè)網(wǎng)D1Net

2019-02-22 08:00:00

Lambda架構(gòu)IOTA
點贊
收藏

51CTO技術(shù)棧公眾號