偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

開源SQL in Hadoop解決方案:我們處于什么位置?

開源 Hadoop
隨著Facebook開源了最近發(fā)布的Presto,已經(jīng)非常擁擠的SQL in Hadoop市場(chǎng)變得更加錯(cuò)綜復(fù)雜。一些開源工具正在努力獲得開發(fā)者的注意:Hortonworks 圍繞著Hive創(chuàng)建的Stinger、Apache Drill、Apache Tajo、Cloudera的Impala、Salesforce的Phoenix(用于HBase)以及現(xiàn)在的Facebook Presto。

隨著Facebook開源了最近發(fā)布的Presto,已經(jīng)非常擁擠的SQL in Hadoop市場(chǎng)變得更加錯(cuò)綜復(fù)雜。一些開源工具正在努力獲得開發(fā)者的注意:Hortonworks 圍繞著Hive創(chuàng)建的Stinger、Apache Drill、Apache Tajo、Cloudera的Impala、Salesforce的Phoenix(用于HBase)以及現(xiàn)在的Facebook Presto。

已經(jīng)在產(chǎn)品環(huán)境中使用Hadoop的組織需要交互式的SQL查詢支持,同時(shí)能夠與已有的BI工具進(jìn)行平滑的集成。來自于eBay的Vijay Madhavan在他的博客Hadoop場(chǎng)景中的SQL一文中聲稱:

現(xiàn)在大部分基于Map-Reduce的分析系統(tǒng)能夠在非交互式和批量SLA領(lǐng)域良好地工作,包括當(dāng)前版本的Hive、Pig、Cascading。許多產(chǎn)品正在努力通過提供交互式“SQL in Hadoop”解決方案支持實(shí)時(shí)交互式SLA。

SQL in Hadoop解決方案的用例包括支持交互式ad-hoc查詢;支持使用MicroStrategy 或者Tableau 這樣的BI系統(tǒng)進(jìn)行報(bào)表/可視化;支持多來源(multi-source)數(shù)據(jù),例如HDFS中的行為型數(shù)據(jù)必須被連接到RDBMS或者其他來源中的人口統(tǒng)計(jì)數(shù)據(jù)。

很多這樣的SQL in Hadoop解決方案在某些方面有共同點(diǎn):

  1. 在元數(shù)據(jù)層面上,好像HCatalog/Hive Metastore將它們自己制定成了跨不同數(shù)據(jù)源管理模式事實(shí)上(de-facto)的標(biāo)準(zhǔn)。
  2. 然后有某些數(shù)據(jù)格式,例如Parquet和ORC,它們對(duì)于選擇的工作負(fù)載而言正在變得越來越流行,同時(shí)在自然環(huán)境中使用的也越來越廣泛。
  3. 大部分解決方案好像都支持各種各樣的ANSI SQL(不同的版本:1992、1999、2003)。

上面幾點(diǎn)可以幫助用戶在不同的SQL in Hadoop解決方案之間遷移,不會(huì)有很多令人頭痛的問題。但是也有一些值得注意的區(qū)別,如下所示:

  1. 解決方案中的一部分是由Apache支持的,同時(shí)也伴隨著社區(qū)的支持(Stinger、Drill、Tajo);其他的則是由單獨(dú)的實(shí)體組織擁有(Impala、Phoenix、Presto)。
  2. 另外,有一部分解決方案在數(shù)據(jù)源方面有一些限制,它們能夠查詢Hadoop生態(tài)系統(tǒng);而另一些從架構(gòu)的角度看更加靈活,可以查詢關(guān)系型數(shù)據(jù)庫(kù)和NoSQL數(shù)據(jù)存儲(chǔ)(Presto、Drill)。
  3. 另一點(diǎn)是允許在數(shù)據(jù)上執(zhí)行的操作不同:有一些是純(分布式)查詢引擎,而另一些則允許執(zhí)行更新操作。

在過去的10到18個(gè)月中,有越來越多的人和商業(yè)實(shí)體已經(jīng)決定嘗試一下,對(duì)存儲(chǔ)在Hadoop中的數(shù)據(jù)實(shí)現(xiàn)低延遲、ad-hoc SQL訪問。無論怎樣,從長(zhǎng)遠(yuǎn)來看由于重疊的用例和環(huán)境喜好的不同有適合多種SQL in Hadoop解決方案生存的空間。

查看英文原文:Open Source SQL-in-Hadoop Solutions: Where Are We?

責(zé)任編輯:奔跑的冰淇淋 來源: InfoQ
相關(guān)推薦

2019-03-26 19:30:47

開源備份解決方案

2009-12-01 08:55:53

2011-02-24 13:35:06

Apache OFBi開源ERP

2019-03-12 10:30:29

開源備份Borg Backup

2014-01-07 13:54:02

HadoopYARN

2013-06-26 10:02:42

Citrix XenServer虛擬化解決方案

2022-12-27 17:57:03

開源汽車充電

2010-10-22 14:20:35

SQL SERVER連

2013-03-14 11:18:30

Microsoft A解決方案

2009-04-16 11:10:59

LinuxIDF開源軟件

2020-02-05 11:20:39

微軟瀏覽器Windows

2010-11-23 13:59:51

Windows Emb

2024-06-19 09:40:21

.NET人臉識(shí)別框架

2013-11-29 12:44:04

HadoopHadoop高可用京東Hadoop

2016-09-19 14:52:12

Hadoophdfs磁盤

2018-12-03 11:59:42

Inventec解決方案

2018-12-03 12:26:30

YADRO解決方案

2018-12-03 12:13:21

Mellanox解決方案

2019-09-26 16:21:07

SODA華為OpenSDS

2012-05-27 16:21:31

IDC華為
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)