偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<style id="bbae7"></style>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

簡(jiǎn)單12招讓Hive運(yùn)行快一點(diǎn)，再快一點(diǎn)

作者：Andrew C. Oliver 2016-04-05 10:12:58

大數(shù)據(jù)

這是一個(gè)很長(zhǎng)的故事，但是我在工作周花了80多個(gè)小時(shí)親自調(diào)整Hive。不用說(shuō)，我不必再頭疼了。因此，為了您的利益，這里有一些建議，讓你的Hive項(xiàng)目比我的運(yùn)行的快一點(diǎn)。

Hive可以讓你在Hadoop上使用SQL，但是在分布系統(tǒng)上的SQL的調(diào)優(yōu)是不同的。這里有12個(gè)技巧能夠幫助你。

Hive并不是一個(gè)關(guān)系型數(shù)據(jù)庫(kù)，但它假裝是大部分情況中的一個(gè)。它有表格，運(yùn)行SQL，并且支持JDBC和ODBC。

這個(gè)啟示有利及不利的消息：Hive不運(yùn)行查詢數(shù)據(jù)庫(kù)方式。這是一個(gè)很長(zhǎng)的故事，但是我在工作周花了80多個(gè)小時(shí)親自調(diào)整Hive。不用說(shuō)，我不必再頭疼了。因此，為了您的利益，這里有一些建議，讓你的Hive項(xiàng)目比我的運(yùn)行的快一點(diǎn)。

1、不要使用MapReduce

你是否相信Tez,Spark或者Impala,但是不相信MapReduce。它是緩慢的，它比Hive還要慢。如果你在Hortonwork的分布，你可以在腳本的頂部輸入 set hive.execution.engine=tez

在子句中使用Impala.希望當(dāng)你的impala不再合適的時(shí)候設(shè)置 hive.execution.engine=spark

2、不要在SQL字符串配對(duì)

注意，尤其是在Hive，如果你在本該是子句的地方配對(duì)字符串，會(huì)產(chǎn)生一個(gè)交叉的產(chǎn)品警告。如果你有一個(gè)幾秒內(nèi)運(yùn)行的查詢，與需要幾分鐘才能配對(duì)的字符串。你***選擇使用多個(gè)工具，允許你添加搜索Hadoop。查看Elasticsearch’s Hiveintegration or Lucidwork’s integration for Solr?；蛘?，哪里有Cloudera Search. RDBMSes 非常善于做這個(gè)，但是Hive就很差了。

Apache Hive擬人畫

3、不要加入一個(gè)子查詢

你***創(chuàng)建一個(gè)臨時(shí)列表，然后加入臨時(shí)表不詢問(wèn)Hive如何智能的處理子查詢。也就是說(shuō)不要這么做。

而是要這么樣做

在這一點(diǎn)上，它真的不應(yīng)該在Hive的進(jìn)化上如此之快，但是它通常是這樣的。

4、使用Parquet或者ORC，但是不要把它們轉(zhuǎn)化成運(yùn)動(dòng)

這就是說(shuō)，相對(duì)用Parquet或者ORC，例如，TEXTFILE。然而，如果你有文本數(shù)據(jù)進(jìn)來(lái)，并且促進(jìn)它變的更結(jié)構(gòu)化，轉(zhuǎn)換到目標(biāo)表。你不能從文本文件加載數(shù)據(jù)到一個(gè)ORC，所以做初始加載到文本。

如果你創(chuàng)建其他的表，你最終會(huì)運(yùn)行不到你的分析。在那里做ORCing，因?yàn)檗D(zhuǎn)換到ORC或者Parquet需要時(shí)間，并且不值得進(jìn)行你的ETL過(guò)程的***步。如果你有簡(jiǎn)單的平面文件進(jìn)來(lái)，并且不做任何調(diào)整。然后你被加載到一個(gè)臨時(shí)表，并且選擇創(chuàng)建一個(gè)ORC或者Parquet。我不嫉妒你因?yàn)樗娴暮苈?/strong>

5、嘗試把矢量化打開(kāi)或者關(guān)閉

增加

在你的腳本的頂端。嘗試讓它們開(kāi)或關(guān)，因?yàn)槭噶炕贖ive的新版本中似乎有一些問(wèn)題。

6、不要用結(jié)構(gòu)加入

我不得不承認(rèn)我原本的大腦的SQL語(yǔ)法依然是SQL-92時(shí)代，所以我無(wú)論如何不傾向于使用結(jié)構(gòu)。但是如果你做一些像對(duì)復(fù)合PKS子句超重復(fù)的事情，結(jié)構(gòu)是方便的。不幸的是，Hive隔斷了它們——尤其是在子句上，當(dāng)然，在較小的數(shù)據(jù)集并沒(méi)有這么做，也沒(méi)有產(chǎn)生任何錯(cuò)誤的時(shí)間。在絕對(duì)禁區(qū)，你得到一個(gè)有趣的向量誤差。這個(gè)限制是沒(méi)有記錄任何我所知道的地方。把這個(gè)看成是一個(gè)有序的方式來(lái)了解你的執(zhí)行引擎的內(nèi)部結(jié)構(gòu)!

7、檢查容器的尺寸

你可能需要為Impala或者Tez增加你容器的尺寸。此外，”建議”尺寸可能不適用于您的系統(tǒng)，如果你有較大的節(jié)點(diǎn)尺寸。你可能要確保你的YARN隊(duì)列和一般的YARN記憶是恰當(dāng)?shù)?。你可能還想把它釘在一個(gè)東西上，這個(gè)東西不是所有人都使用的默認(rèn)隊(duì)列。

8、啟動(dòng)統(tǒng)計(jì)

Hive的確有點(diǎn)愚蠢的東西加入，除非數(shù)據(jù)啟動(dòng)起來(lái)。你可能還想在Impala使用查詢提示。

9、考慮Mapjoin優(yōu)化

如果你對(duì)查詢做了解釋，你可能會(huì)發(fā)現(xiàn)最近Hive的版本足夠聰明到去自動(dòng)應(yīng)用優(yōu)化的。但是你需要去調(diào)整他們。

10、如果可以，把***的表放在***

11、區(qū)分你的朋友……額……

如果你在許多子句的地方有一個(gè)項(xiàng)目，如一個(gè)日期(但是并不是一個(gè)理想的范圍)或者重復(fù)的位置，您可能有您的區(qū)分鍵!分區(qū)的基本意思是”分裂成為它自己的目錄，”這意味著不是在尋找一個(gè)大的文件，Hive查看一個(gè)文件，因?yàn)槟阌媚愕膉oin/where從句讓你只看location=’NC’,這是你的一個(gè)小數(shù)據(jù)集。此外，與列值不同，您可以在負(fù)載數(shù)據(jù)報(bào)表中推分區(qū)。但是，請(qǐng)記住，HDFS不喜歡小的文檔。

12、使用哈希表列的比較

如果你在每個(gè)查詢中比較相同的10個(gè)字段，考慮使用()對(duì)比總結(jié)。這些有時(shí)是非常有用的，你可能會(huì)把它們放在一個(gè)輸出表中。注意Hive0.12是低分辨率的，但是更好的可以使用的值在0.13。

責(zé)任編輯：Ophira 來(lái)源： 36大數(shù)據(jù)

Hive SQL Hadoop

分享到微信

微信掃碼分享

分享到微博

相關(guān)推薦

你的React組件還能跑得再快一點(diǎn)
React提供的虛擬DOM和高效的Diff算法的完美搭配，實(shí)現(xiàn)了對(duì)DOM最小粒度的更新。在大多數(shù)情況下，React對(duì)DOM的渲染效率可以滿足我們的開(kāi)發(fā)需求。

2019-11-28 14:07:46

技術(shù)架構(gòu)代碼

高并發(fā)下，如何讓你的數(shù)據(jù)庫(kù)再快一點(diǎn)？
如何選擇一款最合適的消息隊(duì)列組件呢？本文選擇了RabbitMQ以及Kafka這兩款最為廣泛使用的消息中間，來(lái)探討一下如何綜合考慮各種因素，比如消費(fèi)模式、性能、語(yǔ)言支持、社區(qū)生態(tài)等來(lái)選擇一款稱手的消息隊(duì)列組件。

2020-12-08 09:52:22

數(shù)據(jù)庫(kù)工具技術(shù)

少寫一點(diǎn)，發(fā)布快一點(diǎn)：2025年的前端極簡(jiǎn)主義
在2025年，我們被過(guò)度抽象的組件庫(kù)淹沒(méi)了——原子設(shè)計(jì)、過(guò)度工程化的UI庫(kù)。現(xiàn)在，該是我們聊聊「反潮流」的前端極簡(jiǎn)主義的時(shí)候了。

2025-05-29 00:00:00

UI 庫(kù)前端模塊化

OpenHarmony eTS通用日志組件，寫日志快一點(diǎn)
在開(kāi)發(fā)的過(guò)程中總要通過(guò)日志輸出來(lái)完成一些調(diào)試工作，所以寫日志是避免不了的，日志記錄的功能并不復(fù)雜，卻是必要的、重復(fù)的，每個(gè)頁(yè)面要引入日志工具類。

2022-05-10 10:53:55

日志組件鴻蒙

你會(huì)選擇跑的快一點(diǎn)的傻子還是慢一點(diǎn)的聰明人？
近段時(shí)間，青云QingCloud北京三區(qū)（PEK3）即將正式開(kāi)放運(yùn)營(yíng)的消息傳的沸沸揚(yáng)揚(yáng)，其最大的亮點(diǎn)是推出了SDNNFV2.0概念。據(jù)了解，青云QingCloudSDNNFV2.0適用于未來(lái)公有云和私有云用戶超大規(guī)模的組網(wǎng)需求進(jìn)行的網(wǎng)絡(luò)升級(jí)。

2016-01-06 09:49:59

青云／SDN

創(chuàng)業(yè)成功之“簡(jiǎn)單原則”：簡(jiǎn)單一點(diǎn)，離成功近一點(diǎn)
白手起家的創(chuàng)業(yè)者都希望自己的汗水沒(méi)有白流，但是在成功之前，根本就沒(méi)有人關(guān)心背后的故事，你沒(méi)有聽(tīng)眾，你唯一能理所當(dāng)然地獲得的就是消費(fèi)者冷冰冰地看一眼你的產(chǎn)品。這也是創(chuàng)業(yè)者必須要把握的機(jī)會(huì)。用最短的時(shí)間，最小的篇幅，最有吸引力的內(nèi)容，最簡(jiǎn)單的內(nèi)容來(lái)吸引消費(fèi)者，這才是創(chuàng)業(yè)者應(yīng)該投入精力的地方。

2013-01-08 10:06:43

創(chuàng)業(yè)創(chuàng)業(yè)方法

學(xué)習(xí)優(yōu)化IIS中的一點(diǎn)一點(diǎn)知識(shí)講解
在文章中，我們主要是學(xué)習(xí)優(yōu)化IIS。我們以WindowsServer2003的IIS6.0為例，客戶端環(huán)境為MozillaFirefox3.0，同時(shí)安裝Yahoo的YSlow擴(kuò)展。

2010-05-20 15:29:43

優(yōu)化IIS

微軟：如何讓Windows 7好看一點(diǎn)
如何讓一款每天有上億人使用的操作系統(tǒng)變得妙趣橫生，卻又不冒犯人們天長(zhǎng)日久養(yǎng)成的使用習(xí)慣？來(lái)看看微軟在中國(guó)的設(shè)計(jì)小分隊(duì)是怎么干的吧。

2009-03-06 08:34:03

Windows 7 美化微軟

MySQL斷電恢復(fù)的一點(diǎn)簡(jiǎn)單分析
我首先是要確認(rèn)是否為線上業(yè)務(wù)還是測(cè)試環(huán)境，線上業(yè)務(wù)來(lái)說(shuō)這個(gè)影響還是很大的。如果數(shù)據(jù)庫(kù)無(wú)法啟動(dòng)，首要任務(wù)還是把數(shù)據(jù)庫(kù)啟動(dòng)，然后在這個(gè)基礎(chǔ)上查看丟失的數(shù)據(jù)程度，安排數(shù)據(jù)修復(fù)的事宜。

2017-09-27 13:42:42

數(shù)據(jù)庫(kù)MySQL 斷電恢復(fù)

LINQ To SQL的一點(diǎn)討論
LINQToSQL操作的討論這里主要向你介紹了LINQToSQL分頁(yè)失敗后會(huì)有什么結(jié)果呢？那么本文就向你介紹了相關(guān)的一些討論以及比較，希望對(duì)你有所幫助。

2009-09-14 19:44:27

LINQ To SQL

JDK卸載的一點(diǎn)感受
JDK卸載是什么意思呢？有的時(shí)候在開(kāi)發(fā)之前卻發(fā)現(xiàn)自己的程序運(yùn)行不了或是其他的問(wèn)題，JDK卸載這篇文章就向你談?wù)勥@方面的情況。

2009-07-09 15:09:05

JDK卸載

關(guān)于Json的一點(diǎn)總結(jié)
我們會(huì)經(jīng)常用到Json來(lái)處理少量的數(shù)據(jù)。因?yàn)楦袷胶?jiǎn)單，操作方便，而且Javascript本事就支持Json格式的處理功能。所以建議大家使用。

2012-03-27 08:49:19

Json

每天學(xué)一點(diǎn)（內(nèi)部類）
每天學(xué)一點(diǎn)，今天正好學(xué)習(xí)學(xué)習(xí)內(nèi)部類，長(zhǎng)時(shí)間不用，好動(dòng)?xùn)|東忘光了?？偨Y(jié)一下吧，所謂內(nèi)部類就是在類的內(nèi)部申明另一個(gè)類，因?yàn)橹挥挟?dāng)前類能夠訪問(wèn)到內(nèi)部類，所以內(nèi)部類相對(duì)來(lái)說(shuō)是非常安全的，另外內(nèi)部類可以繼承和實(shí)現(xiàn)其他類和接口，所以可以用多個(gè)內(nèi)部類變相的實(shí)現(xiàn)多繼承(其實(shí)接口就可以模擬多繼承)。另外用內(nèi)部類可以實(shí)現(xiàn)閉包的功能。

2011-03-15 10:41:05

內(nèi)部類

Ruby存取器一點(diǎn)通
Ruby存取器總共分為兩種類型，分別為writer和reader。我們將為大家列出一個(gè)簡(jiǎn)單的代碼示例方便大家理解Ruby存取器的概念。

2009-12-15 14:27:30

Ruby存取器

數(shù)字化技術(shù)：讓零售企業(yè)離消費(fèi)者近一點(diǎn)，再近一點(diǎn)
你希望未來(lái)的購(gòu)物是什么樣的“未來(lái)也許有這么一套系統(tǒng)，人一站上去，所有人體數(shù)據(jù)就都有了，后臺(tái)能迅速根據(jù)這些數(shù)據(jù)打造出完全符合這一體形的衣服出來(lái)，那多酷!這個(gè)就是未來(lái)，所有的零售都應(yīng)該是圍繞消費(fèi)者體驗(yàn)的?！边@是郎姿股份田均輪所暢想的未來(lái)購(gòu)物。

2017-01-03 10:42:54

零售企業(yè)

蘋果iOS 13的煥新功能，總有幾個(gè)讓你耳目一新
2019年已過(guò)，距離iOS13.3正式版的推送也快一個(gè)月了，相信大部分用戶已經(jīng)用上了iOS13.3。盡管iPhone用戶往往對(duì)iOS的升級(jí)并不敏感，每次啟動(dòng)速度快一點(diǎn)，app占用空間少一點(diǎn)，F(xiàn)aceID再快一點(diǎn)，iOS的進(jìn)化往往是在潛移默化中進(jìn)行的，而非一蹴而就。

2020-01-09 11:16:07

iOS 13 蘋果 iPhone

項(xiàng)目管理可以簡(jiǎn)單一點(diǎn)之團(tuán)隊(duì)建設(shè)
我們一談到管理一個(gè)軟件開(kāi)發(fā)項(xiàng)目就會(huì)頭皮發(fā)麻，其實(shí)大可不必，項(xiàng)目管理可以簡(jiǎn)單一點(diǎn)。

2011-11-30 09:26:25

項(xiàng)目管理

這個(gè)世界，又多了一點(diǎn)抽象！
OpenTracing誕生于2016年11月，CNCF接受了它，成為自己基金會(huì)的第三個(gè)項(xiàng)目。但是google并不認(rèn)為這個(gè)東西是標(biāo)準(zhǔn)，所以推出了自己的OpenCensus規(guī)范。

2021-06-02 18:46:13

監(jiān)控日志 Prometheus

關(guān)于 Swift 的一點(diǎn)初步看法
雖然四點(diǎn)半就起床去排隊(duì)等入場(chǎng)，結(jié)果還是只能坐在了蠻后面的位置看著大屏幕參加了今年的Keynote。其實(shí)今年OSX和iOS的更新亮點(diǎn)都不少，但是顯然風(fēng)頭和光芒都讓橫空出世的Swift給搶走了。這部分內(nèi)容因?yàn)椴皇荖DA，所以可以提前說(shuō)一說(shuō)。

2014-06-04 10:48:38

Swift 蘋果 iOS

相似話題

數(shù)據(jù)分析
 1715內(nèi)容

數(shù)據(jù)可視化
 317內(nèi)容

商業(yè)智能
 138內(nèi)容

Hadoop
840內(nèi)容
全部話題

同話題下的熱門內(nèi)容

Flink Checkpoint 完整過(guò)程技術(shù)解析（附源碼）騰訊面試：Flink 與 Spark 容錯(cuò)機(jī)制有什么區(qū)別？Apache Paimon 核心配置參數(shù)詳解（三）做數(shù)據(jù)十年，終于見(jiàn)到能落地的“經(jīng)營(yíng)分析思路”

相關(guān)專題更多

戴爾在線研討會(huì)：從“模型驅(qū)動(dòng)”到“數(shù)據(jù)驅(qū)動(dòng)”的智算架構(gòu)創(chuàng)新

看懂惠普 ZBookX 移動(dòng)工作站的設(shè)計(jì)美學(xué)與效能突破

2025-10-11 13:42:35

技術(shù)薈萃 | 親身體驗(yàn) | 交流盛宴

2025-04-23 08:49:09

我收藏的內(nèi)容

微博

QQ

微信

復(fù)制鏈接

微信掃碼分享

51CTO業(yè)務(wù)

媒體
51CTO CIOAge HC3i Techplur
社區(qū)
51CTO博客軟考社區(qū)鴻蒙開(kāi)發(fā)者社區(qū)AI.x社區(qū)
教育
51CTO學(xué)堂精培企業(yè)培訓(xùn)CTO訓(xùn)練營(yíng)

51CTO學(xué)堂

51CTO學(xué)堂企業(yè)版

51CTO官微

51CTO

關(guān)于我們&條款

關(guān)于我們

新聞動(dòng)態(tài)

站點(diǎn)地圖

意見(jiàn)反饋

English

用戶協(xié)議

隱私協(xié)議

北京市海淀區(qū)中關(guān)村南1條甲1號(hào)ECO中科愛(ài)克大廈6-7層

北京市公安局海淀分局備案編號(hào)：110108002980號(hào)
營(yíng)業(yè)執(zhí)照京ICP備09067568號(hào)

Copyright ? 2005-2025 51CTO.COM 京ICP證060544 版權(quán)所有未經(jīng)許可請(qǐng)勿轉(zhuǎn)載

營(yíng)業(yè)執(zhí)照出版物經(jīng)營(yíng)許可證

友情鏈接

新浪科技騰訊科技網(wǎng)易科技鳳凰科技驅(qū)動(dòng)科技科技行者 TechWeb 艾瑞網(wǎng)站長(zhǎng)之家速途網(wǎng)中國(guó)經(jīng)濟(jì)新聞網(wǎng)IT之家工聯(lián)網(wǎng)極客公園 236視頻會(huì)議中國(guó)IDC圈企業(yè)網(wǎng)D1Net 投資界次方元火山引擎

51CTO技術(shù)棧公眾號(hào)

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

在線客服

媒體
51CTO CIOAge HC3i

社區(qū)
51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育
51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

感谢您访问我们的网站，您可能还对以下资源感兴趣：
偷偷摘套内射激情视频