偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

面試官:Hive表有數(shù)據(jù),但為什么 Iimpala 查詢不到數(shù)據(jù)?

大數(shù)據(jù) 數(shù)據(jù)分析
我們知道,distribute 是分配、分布的意思,顧名思義,hive中(distribute by + “表中字段”)關(guān)鍵字就是控制map輸出結(jié)果的分發(fā),相同字段的map輸出會(huì)發(fā)到一個(gè)reduce節(jié)點(diǎn)去處理。

張工是一名程序員,做java開發(fā)的,有兩年多開發(fā)經(jīng)驗(yàn),有次到一家軟件公司應(yīng)聘大數(shù)據(jù)開發(fā)崗位,面試官問了他這樣一個(gè)問題。

hive表有數(shù)據(jù),但為什么impala查詢不到數(shù)據(jù)?

你能說說這是什么情況導(dǎo)致的,有什么辦法解決方案嗎?

對(duì)于這個(gè)問題,我們不妨來回顧下,什么情況下hive表有數(shù)據(jù),但impala沒有數(shù)據(jù)的情況。

1. 問題描述

用insert overwrite方式往hive寫入的數(shù)據(jù),數(shù)據(jù)寫入成功了,在hive查詢是可以查到數(shù)據(jù)的,但在impala刷新元數(shù)據(jù)后,查詢卻沒有查到,剛開始以為是元數(shù)據(jù)刷新不成功,再用命令

invalidate metadata table_name
refresh table_name

刷新成功后還是沒有數(shù)據(jù),返回結(jié)果為空。

2.問題追溯

往hive表寫入數(shù)據(jù)sql里使用了union ,導(dǎo)致hdfs目錄結(jié)構(gòu)多了一層,本來數(shù)據(jù)是在分區(qū)第一層的,使用了union 后,數(shù)據(jù)存儲(chǔ)到分區(qū)底下的文件夾了。

導(dǎo)致impala無法訪問到具體數(shù)據(jù)。impala版本2.12,查看impala版本命令(impala-shell -v)

3.解決方案

在寫入數(shù)據(jù)sql 后面加上 distribute by + 表中字段 就可以了。

這是為什么呢,為什么加上distribute by +表中字段 就可以了。

我們知道,distribute 是分配、分布的意思,顧名思義,hive中(distribute by + “表中字段”)關(guān)鍵字就是控制map輸出結(jié)果的分發(fā),相同字段的map輸出會(huì)發(fā)到一個(gè)reduce節(jié)點(diǎn)去處理。

總結(jié)

hive表有數(shù)據(jù),impala表沒有數(shù)據(jù),檢查是否刷新元數(shù)據(jù),操作命令:

invalidate metadata

refresh table_name。已經(jīng)成功刷新元數(shù)據(jù)了,impala依然沒有數(shù)據(jù), 檢查寫入hive sql 是否使用union方式,如果是,在sql 后面加上(distribute by + 表中字段 )。

拓展:

distribute by、sort by、cluster by

責(zé)任編輯:武曉燕 來源: 愛開發(fā)
相關(guān)推薦

2022-07-06 13:48:24

RedisSentinel機(jī)制

2023-12-06 09:10:28

JWT微服務(wù)

2020-10-24 15:50:54

Java值傳遞代碼

2021-02-19 10:02:57

HTTPSJava安全

2021-01-21 07:53:29

面試官Promis打印e

2021-07-20 10:45:50

數(shù)據(jù)庫MySQLdelete

2021-07-06 07:08:18

管控數(shù)據(jù)數(shù)倉

2021-12-20 10:30:33

forforEach前端

2023-12-20 14:35:37

Java虛擬線程

2022-12-27 08:39:54

MySQL主鍵索引

2023-07-05 08:17:38

JDK動(dòng)態(tài)代理接口

2024-08-28 11:23:33

2018-10-22 14:28:26

面試官數(shù)據(jù)公司

2022-12-22 14:32:37

JavaScript編程語言

2023-06-05 07:57:53

Kafka消息事務(wù)消息

2024-11-14 09:29:38

2024-09-19 08:10:54

2021-09-07 10:44:33

Java 注解開發(fā)

2020-08-24 10:55:41

數(shù)據(jù)庫雙寫代碼

2020-12-23 13:29:15

微服務(wù)架構(gòu)面試官
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)