偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

銀行湖倉一體實(shí)時(shí)數(shù)倉解決方案

作者：天涯咫尺TGH 2024-09-03 14:59:00

數(shù)字化轉(zhuǎn)型

湖倉一體實(shí)時(shí)數(shù)倉將數(shù)據(jù)湖的靈活性、數(shù)據(jù)多樣性、豐富生態(tài)與數(shù)據(jù)倉庫的企業(yè)級數(shù)據(jù)分析能力進(jìn)行了融合，對實(shí)時(shí)數(shù)據(jù)模型建設(shè)具有重要價(jià)值。未來，隨著農(nóng)行數(shù)據(jù)湖建設(shè)，實(shí)時(shí)數(shù)倉將融合數(shù)據(jù)湖基礎(chǔ)底座建設(shè)，構(gòu)建穩(wěn)定、全面、高擴(kuò)展性的實(shí)時(shí)數(shù)據(jù)基礎(chǔ)層，建設(shè)和沉淀農(nóng)行共性實(shí)時(shí)數(shù)據(jù)資產(chǎn)，滿足不同實(shí)時(shí)分析應(yīng)用用數(shù)要求。

數(shù)字化轉(zhuǎn)型驅(qū)動(dòng)下，實(shí)時(shí)化需求日益成為金融業(yè)數(shù)據(jù)應(yīng)用新常態(tài)。傳統(tǒng)離線數(shù)倉“T+N”數(shù)據(jù)供給模式，難于滿足“T+0”等高時(shí)效場景需求；依托Storm、spark Streaming、Flink等實(shí)時(shí)計(jì)算框架提供“端到端”的實(shí)時(shí)加工模式，無法沉淀實(shí)時(shí)數(shù)據(jù)資產(chǎn)，存在實(shí)時(shí)數(shù)據(jù)復(fù)用性低、煙囪式垂直建設(shè)等不足。

為此，可通過建設(shè)實(shí)時(shí)數(shù)倉解決上述問題，實(shí)時(shí)數(shù)倉在離線數(shù)倉基礎(chǔ)上進(jìn)一步滿足時(shí)效性的要求，依托流批一體、湖倉一體、云計(jì)算等技術(shù)，兼具時(shí)效性和靈活性優(yōu)勢，可作為金融業(yè)實(shí)時(shí)數(shù)據(jù)的生產(chǎn)、存儲和使用平臺。

為解決傳統(tǒng)數(shù)倉數(shù)據(jù)時(shí)效性低等問題，實(shí)時(shí)數(shù)倉在技術(shù)路線上有多種路徑：

一種是基于Lambda架構(gòu)的實(shí)時(shí)數(shù)倉，作為當(dāng)前主流實(shí)時(shí)數(shù)倉架構(gòu)，其在現(xiàn)有成熟離線加工鏈路上，增加實(shí)時(shí)計(jì)算鏈路，參照ODS、DWD、DWS等模型分層組織理念，實(shí)現(xiàn)與離線數(shù)倉的協(xié)同，通常采用kafka消息隊(duì)列、Flink計(jì)算引擎等組合實(shí)現(xiàn)，建設(shè)成本較低，但架構(gòu)復(fù)雜，運(yùn)維成本較高；
一種是基于Kappa架構(gòu)的實(shí)時(shí)數(shù)倉，與Lambda架構(gòu)相比，其移除了離線生產(chǎn)鏈路，完全依賴實(shí)時(shí)加工鏈路，其優(yōu)點(diǎn)是數(shù)據(jù)來源統(tǒng)一，架構(gòu)相對簡化，節(jié)約開發(fā)及日常運(yùn)維成本，但不易進(jìn)行數(shù)據(jù)回溯計(jì)算，比較消耗內(nèi)存計(jì)算資源；
此外，還有一類采用實(shí)時(shí)OLAP技術(shù)，將聚合分析計(jì)算由OLAP引擎承擔(dān)，減輕實(shí)時(shí)計(jì)算部分的聚合處理壓力，分析自由度高，減輕了計(jì)算引擎的處理壓力，但對引擎的吞吐、存儲和實(shí)時(shí)攝入、分析性能要求較高，此類實(shí)時(shí)數(shù)倉通?；谏虡I(yè)數(shù)據(jù)庫產(chǎn)品，如Hologres、GaussDB等。

同時(shí)，隨著Hudi、Iceberg、Delta Lake等數(shù)據(jù)湖技術(shù)發(fā)展，依托數(shù)據(jù)湖底座的湖倉一體實(shí)時(shí)數(shù)倉建設(shè)正在興起，對推進(jìn)企業(yè)數(shù)字化轉(zhuǎn)型具有重要價(jià)值：

一是彌補(bǔ)現(xiàn)有架構(gòu)的不足，湖倉一體實(shí)時(shí)數(shù)倉彌補(bǔ)了傳統(tǒng)數(shù)倉對于數(shù)據(jù)實(shí)時(shí)處理能力的不足，具備多引擎、多類型數(shù)據(jù)處理能力，流批一體加工類型豐富，避免了傳統(tǒng)數(shù)倉無法分析非結(jié)構(gòu)化數(shù)據(jù)等問題。
二是降低企業(yè)成本，湖倉一體實(shí)時(shí)數(shù)倉提供統(tǒng)一流批數(shù)據(jù)底座，避免不同平臺間數(shù)據(jù)移動(dòng)，降低數(shù)據(jù)流動(dòng)帶來的開發(fā)成本及計(jì)算存儲開銷，提升企業(yè)效率。
三是提升企業(yè)級數(shù)據(jù)分析整合能力，湖倉一體實(shí)時(shí)數(shù)倉打破了數(shù)據(jù)湖與數(shù)據(jù)倉庫割裂的體系，將數(shù)據(jù)湖的靈活性、數(shù)據(jù)多樣性以及豐富的生態(tài)與數(shù)據(jù)倉庫的企業(yè)級數(shù)據(jù)分析能力進(jìn)行了融合。

實(shí)時(shí)數(shù)倉建設(shè)思路

自農(nóng)業(yè)銀行大數(shù)據(jù)平臺建設(shè)以來，經(jīng)過多年的不斷發(fā)展，沉淀了豐富的離線數(shù)倉模型資產(chǎn)，具備PB級數(shù)據(jù)存儲和處理能力，支撐數(shù)百個(gè)應(yīng)用場景。但總體來看，當(dāng)前數(shù)據(jù)服務(wù)供給時(shí)效仍以T+N天為主，雖然依托實(shí)時(shí)流計(jì)算平臺支撐了實(shí)時(shí)存款大屏等高時(shí)效應(yīng)用，但“端到端”的流加工模式難于實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)資產(chǎn)沉淀和復(fù)用。

實(shí)時(shí)數(shù)倉基于數(shù)據(jù)湖技術(shù)能力，支持構(gòu)建穩(wěn)定、全面、高擴(kuò)展性的實(shí)時(shí)數(shù)據(jù)基礎(chǔ)層，建設(shè)和沉淀農(nóng)行共性實(shí)時(shí)數(shù)據(jù)資產(chǎn)，滿足不同實(shí)時(shí)分析應(yīng)用用數(shù)要求，提升數(shù)據(jù)模型加工時(shí)效性（見下圖），結(jié)合Flink、Hudi等數(shù)據(jù)湖存儲計(jì)算引擎，支持流數(shù)據(jù)、文件等數(shù)據(jù)入湖，利用Flink流批一體計(jì)算引擎層次化組織企業(yè)級實(shí)時(shí)資產(chǎn)，促進(jìn)全行實(shí)時(shí)分析應(yīng)用的統(tǒng)一。

相比前期的實(shí)時(shí)流計(jì)算平臺，它具有面向主題、有集成性、相對穩(wěn)定等的數(shù)據(jù)倉庫本身的特性，提供穩(wěn)定、持續(xù)的實(shí)時(shí)數(shù)據(jù)統(tǒng)一集成能力，支持共性、個(gè)性層次化實(shí)時(shí)數(shù)據(jù)模型的構(gòu)建，滿足不同類型應(yīng)用對流批數(shù)據(jù)加工模式的痛點(diǎn)需求。

為了提升實(shí)時(shí)數(shù)據(jù)資產(chǎn)的復(fù)用性，支持不同的應(yīng)用，實(shí)時(shí)數(shù)倉采用數(shù)據(jù)分層理念組織實(shí)時(shí)數(shù)據(jù)資產(chǎn)。同時(shí)，考慮到層次增加會提高數(shù)據(jù)處理成本和時(shí)延，為縮短加工鏈路，實(shí)時(shí)數(shù)倉資產(chǎn)組織為ODS、DWD、DWS，外加DIM層。

lODS層

基于Hudi存儲原始數(shù)據(jù)，Binlog日志消息轉(zhuǎn)換成Upsert流式入湖，數(shù)據(jù)與生產(chǎn)源系統(tǒng)數(shù)據(jù)保持一致，保持原子粒度的數(shù)據(jù)。

lDWD層

和離線數(shù)倉中DWD層主題劃分一致，主要是為了解決一些原始數(shù)據(jù)中存在的噪聲、數(shù)據(jù)不完整和數(shù)據(jù)格式不一致的問題，形成規(guī)范、統(tǒng)一的數(shù)據(jù)源。DWD層包括數(shù)據(jù)解析、業(yè)務(wù)整合、臟數(shù)據(jù)的清洗和模型規(guī)范化。

lDIM層

DIM層是實(shí)時(shí)數(shù)倉中的維度數(shù)據(jù)，主要分為２類：變化頻率低的和變化頻率高的維度數(shù)據(jù)。對于變化頻率較低的維度數(shù)據(jù)，比如說機(jī)構(gòu)信息等，可以通過離線維度數(shù)據(jù)同步到緩存或者通過公共維度服務(wù)進(jìn)行查詢；對于變化頻率較高的維度數(shù)據(jù)，比如說匯率、價(jià)格等信息，則需要監(jiān)聽其變化情況，維護(hù)變動(dòng)信息。

lDWS層

DWS層即匯總層，主要是對共性指標(biāo)的統(tǒng)一加工，同時(shí)根據(jù)主題進(jìn)行多維度的匯總等操作。特別地，對于時(shí)間區(qū)間的匯總，可以使用Flink中豐富的時(shí)間窗口實(shí)現(xiàn)。

實(shí)時(shí)數(shù)倉建設(shè)關(guān)鍵技術(shù)

實(shí)時(shí)數(shù)據(jù)入湖

實(shí)時(shí)數(shù)據(jù)入湖是湖倉一體實(shí)時(shí)數(shù)倉數(shù)據(jù)模型建設(shè)的基礎(chǔ)，與流計(jì)算模式下“即用即棄”的數(shù)據(jù)處理策略不同，湖倉一體實(shí)時(shí)數(shù)倉借助Hudi數(shù)據(jù)湖存儲引擎對實(shí)時(shí)流數(shù)據(jù)進(jìn)行攝入存儲，以支持流讀、批讀等流批一體處理。為了支持實(shí)時(shí)數(shù)據(jù)Upsert語義，并提供ACID事務(wù)保證，實(shí)時(shí)入湖環(huán)節(jié)會帶來較高的處理開銷，因此為了保障大規(guī)模實(shí)時(shí)數(shù)據(jù)持續(xù)穩(wěn)定入湖集成，該環(huán)節(jié)對Hudi表類型、壓縮機(jī)制、Flink checkpoint間隔設(shè)置等有較高要求。

實(shí)時(shí)入湖表類型選取方面，根據(jù)讀寫特性的不同，Hudi表類型區(qū)分為MOR（Merge On Read）、COW（Copy On Write）模式。MOR方式通過不斷追加日志，在讀取時(shí)進(jìn)行合并，適用于高吞吐寫入場景；COW方式是在寫入就進(jìn)行合并操作，適合快速讀取場景。為保障農(nóng)行高吞吐實(shí)時(shí)交易等數(shù)據(jù)入湖，對于個(gè)人活期交易明細(xì)等大表優(yōu)先選擇MOR方式。

入湖過程中持續(xù)的并發(fā)寫入，容易導(dǎo)致數(shù)據(jù)規(guī)模的膨脹和放大，需要周期性進(jìn)行壓縮。同時(shí)，Hudi數(shù)據(jù)的可見性依賴于Flink計(jì)算引擎的CheckPoint間隔設(shè)置，在寫入操作和壓縮操作的雙重壓力下，為了避免壓縮操作與checkpoint的相互阻礙，可以采用離線壓縮模式，提升作業(yè)的穩(wěn)定性。

此外，針對各表不同的數(shù)據(jù)量，實(shí)時(shí)數(shù)倉會針對實(shí)時(shí)處理作業(yè)的運(yùn)行CPU、內(nèi)存進(jìn)行調(diào)整，以滿足接入作業(yè)運(yùn)行需求；為了保障后續(xù)的數(shù)據(jù)血緣追蹤，采用Hive MetaStore作為技術(shù)元數(shù)據(jù)的存儲。

流批數(shù)據(jù)模型加工

實(shí)時(shí)數(shù)據(jù)通過實(shí)時(shí)入湖集中接入數(shù)據(jù)湖后，將轉(zhuǎn)換成流批一體的數(shù)據(jù)格式，支持流批方式的讀取和加工，針對實(shí)時(shí)數(shù)據(jù)模型構(gòu)建過程中的數(shù)據(jù)依賴特點(diǎn)，實(shí)時(shí)數(shù)倉在數(shù)據(jù)資產(chǎn)模型的加工能力支持上有不同的側(cè)重點(diǎn)。

情形一：數(shù)據(jù)模型完全依賴于增量數(shù)據(jù)：增量數(shù)據(jù)均可以實(shí)時(shí)入倉，并完成后續(xù)鏈路的實(shí)時(shí)流轉(zhuǎn)，得到分鐘級結(jié)果；

情形二：數(shù)據(jù)模型部分依賴于存量（無變化）數(shù)據(jù)：對于全量數(shù)據(jù)無變化的依賴數(shù)據(jù)，可以將存量數(shù)據(jù)進(jìn)行加速（緩存至Redis/Hbase等），實(shí)現(xiàn)分鐘級模型生成，但對存量數(shù)據(jù)的管理要求很高。

情形三：數(shù)據(jù)模型部分依賴于全量（存量+增量）數(shù)據(jù)：對于全量數(shù)據(jù)緩慢變化的依賴數(shù)據(jù)，可以將存量數(shù)據(jù)進(jìn)行加速（緩存至Redis/Hbase等），并實(shí)時(shí)維護(hù)數(shù)據(jù)變化，實(shí)現(xiàn)分鐘級模型生成，但對全量數(shù)據(jù)的管理要求很高。

情形四：數(shù)據(jù)模型完全依賴于全量（存量+增量）數(shù)據(jù)：分鐘級就緒，需要時(shí)觸發(fā)批量調(diào)度執(zhí)行，適用于批量模式；此外，結(jié)合農(nóng)行數(shù)據(jù)模型的特點(diǎn)，實(shí)時(shí)數(shù)倉對明細(xì)類實(shí)時(shí)數(shù)據(jù)、主檔類實(shí)時(shí)數(shù)據(jù)的處理策略有所不同。

① 明細(xì)類實(shí)時(shí)數(shù)據(jù) 對于明細(xì)類交易數(shù)據(jù)，數(shù)據(jù)前后關(guān)聯(lián)度較低，可以采用流式寫入、流式讀取的方式進(jìn)行增量處理。

② 主檔類實(shí)時(shí)數(shù)據(jù) 對于主檔類數(shù)據(jù)，數(shù)據(jù)需要考慮存量和增量的關(guān)系，而存量數(shù)據(jù)往往數(shù)據(jù)量比較大，無法直接進(jìn)行關(guān)聯(lián)處理，可以采用流式更新、批量讀取的模式，及時(shí)準(zhǔn)備好全量數(shù)據(jù)，實(shí)現(xiàn)模型的即時(shí)加工。

維度數(shù)據(jù)服務(wù)

為提升數(shù)據(jù)加工時(shí)效，實(shí)時(shí)數(shù)據(jù)模型對常用的基礎(chǔ)維度進(jìn)行提前補(bǔ)齊，在滿足吞吐量等情況下，實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)擴(kuò)維，以空間換取時(shí)間，為數(shù)據(jù)分組匯總等提供基礎(chǔ)數(shù)據(jù)準(zhǔn)備。例如：主檔類等具有存量數(shù)據(jù)的模型，可維護(hù)在Hbase、Redis等KV存儲引擎中，基于Ad hoc查找的方式實(shí)現(xiàn)數(shù)據(jù)的拼接處理，實(shí)現(xiàn)加工鏈路提速，不會由于主檔類數(shù)據(jù)的加入而導(dǎo)致全鏈路時(shí)效性降低。維度服務(wù)作為一種特殊的集成方式，提供全量上線、實(shí)時(shí)更新和批量增量更新模式。

維度加載

首次上線時(shí)，從大數(shù)據(jù)平臺主庫提取完備的全量數(shù)據(jù)，基于離線加載方式完成維度數(shù)據(jù)的全量鋪底，如基于Bulkload載入全量數(shù)據(jù)到Hbase。

維度更新

維度上線后，為了及時(shí)地反映維度信息的變化，維度服務(wù)同時(shí)會接入維度變化的實(shí)時(shí)流數(shù)據(jù)進(jìn)行更新。

維度修正

為了減少離線、實(shí)時(shí)通道維度數(shù)據(jù)的偏差放大，維度服務(wù)將周期性進(jìn)行維度數(shù)據(jù)同步更新修正，實(shí)現(xiàn)最新的維度數(shù)據(jù)和離線維度數(shù)據(jù)的一致性，避免后續(xù)計(jì)算口徑出現(xiàn)大的偏差。

寬表模型加工

寬表是按照“向主流標(biāo)準(zhǔn)靠攏”的方法對數(shù)據(jù)中臺基礎(chǔ)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化組織整理形成的企業(yè)級數(shù)據(jù)模型表，作為農(nóng)行新一代大數(shù)據(jù)模型規(guī)范，經(jīng)過不斷迭代和發(fā)展，形成了理財(cái)、貸款等多種領(lǐng)域?qū)挶怼ｋx線寬表模型核心是基于T+N的離線數(shù)據(jù)處理，因此具有強(qiáng)一致性、高吞吐性等特點(diǎn)，另一方面，為了保證更強(qiáng)的靈活性，離線寬表模型依賴關(guān)系錯(cuò)綜復(fù)雜，流轉(zhuǎn)鏈路較長。

對于實(shí)時(shí)寬表而言，直接將離線寬表模型照搬到實(shí)時(shí)寬表模型成本代價(jià)高昂，加之加工環(huán)節(jié)的相互制約，時(shí)效性提升受限，不易實(shí)現(xiàn)成本和可行性價(jià)值的最大化。在實(shí)際業(yè)務(wù)場景中，很多場景其實(shí)并不要求全字段實(shí)時(shí)化，而是專注于拿到實(shí)時(shí)的事實(shí)數(shù)據(jù)，因此實(shí)時(shí)數(shù)倉在T-1離線寬表基礎(chǔ)上，通過擴(kuò)增高時(shí)效字段等方式進(jìn)一步滿足高時(shí)效場景。

實(shí)時(shí)數(shù)倉建設(shè)探索實(shí)踐

實(shí)時(shí)理財(cái)寬表探索

為探索寬表時(shí)效性提升路徑，實(shí)時(shí)數(shù)倉以理財(cái)寬表為試點(diǎn)，探索實(shí)時(shí)寬表建設(shè)思路。通過梳理整體加工鏈路，發(fā)現(xiàn)當(dāng)前離線寬表模型具有如下顯著特點(diǎn)：

一是增量模式少，增全量模式多，其中交易拼接通用寬表增量與增全量加工比例為（3/25），理財(cái)產(chǎn)品歷史通用寬表（0/6），理財(cái)合約拼接通用寬表（0/43）。
二是模型層次多，加工鏈路普遍較長，層次普遍在3~7層。
三是模型之間依賴復(fù)雜，存在較多關(guān)聯(lián)，模型之間存在大量Join操作，個(gè)別模型單次存在11張表關(guān)聯(lián)。

因此，為了實(shí)現(xiàn)上述復(fù)雜鏈路的時(shí)效性提升，對于明細(xì)數(shù)據(jù)，實(shí)時(shí)數(shù)倉基于Upsert模式實(shí)現(xiàn)明細(xì)數(shù)據(jù)的維護(hù)，按時(shí)間分區(qū)分鐘級流式寫入，提供流式讀增量數(shù)據(jù)，支持了分鐘級數(shù)據(jù)鮮度。

對于主檔類數(shù)據(jù)，由于具有歷史數(shù)據(jù)，實(shí)時(shí)數(shù)倉采用Bulk Insert模式實(shí)現(xiàn)存量數(shù)據(jù)的鋪底入湖，通過Hudi全量數(shù)據(jù)接增量的方式，解決歷史數(shù)據(jù)首次加載，并平滑銜接增量數(shù)據(jù)的問題。同時(shí)，基于流式寫分鐘級更新數(shù)據(jù)狀態(tài)、批量讀取模式提供最新全量快照結(jié)果。

通過對明細(xì)、主檔類基礎(chǔ)數(shù)據(jù)的實(shí)時(shí)化處理，可以為寬表模型提供分鐘級數(shù)據(jù)，提升寬表產(chǎn)出時(shí)效，支撐重點(diǎn)鏈路分支分鐘級、整體T+0的數(shù)據(jù)供給時(shí)效。

實(shí)時(shí)標(biāo)簽場景實(shí)踐

針對網(wǎng)金等實(shí)時(shí)標(biāo)簽建設(shè)需求，實(shí)時(shí)數(shù)倉通過個(gè)人活期交易、掌銀新注冊客戶等明細(xì)模型建設(shè)，復(fù)用同一共性實(shí)時(shí)模型數(shù)據(jù)基礎(chǔ)上，拆分跨行交易、個(gè)人基金、代發(fā)工資3類主題數(shù)據(jù)，支持標(biāo)簽中心不同類型實(shí)時(shí)標(biāo)簽構(gòu)建。此模式按照主題進(jìn)行管理，進(jìn)行統(tǒng)一的加工，比如清洗、過濾、擴(kuò)維等，給下游提供直接可用的數(shù)據(jù)，避免了數(shù)據(jù)的重復(fù)加工，同時(shí)也實(shí)現(xiàn)了實(shí)時(shí)數(shù)據(jù)的存儲回溯，可滿足后續(xù)實(shí)時(shí)標(biāo)簽等多場景建設(shè)。

在個(gè)人活期交易明細(xì)共性模型資產(chǎn)建設(shè)實(shí)踐中，為了滿足單表日均億級的高吞吐入湖集成，實(shí)時(shí)數(shù)倉從Hudi表類型、數(shù)據(jù)分區(qū)、Hudi壓縮等措施優(yōu)化配置，實(shí)現(xiàn)高吞吐實(shí)時(shí)流數(shù)據(jù)場景下的穩(wěn)定入湖：

1）Hudi表選型方面，通過長周期疲勞測試發(fā)現(xiàn)，此場景下基于COW類型作業(yè)會出現(xiàn)較大反壓、延遲逐漸放大等情形，為了避免延遲情況，實(shí)時(shí)數(shù)倉基于MOR表的模式，滿足高吞吐實(shí)時(shí)數(shù)據(jù)的快速入湖；

2）數(shù)據(jù)分區(qū)方面，實(shí)時(shí)數(shù)倉對明細(xì)數(shù)據(jù)模型進(jìn)行日期分區(qū)，考慮到明細(xì)類數(shù)據(jù)插入多、更新少等特點(diǎn)，為了減輕Hudi的Index索引壓力，進(jìn)一步降低索引存效時(shí)間；

3）壓縮方面，實(shí)時(shí)數(shù)倉考慮到在線壓縮對入湖任務(wù)造成的不穩(wěn)定性，采用了離線壓縮，通過腳本控制壓縮計(jì)劃的執(zhí)行，確保不會出現(xiàn)積壓的問題。

基于沉淀的共性模型資產(chǎn)，實(shí)時(shí)數(shù)倉先后支撐大額動(dòng)賬實(shí)時(shí)線索、掌銀新客實(shí)時(shí)標(biāo)簽、代發(fā)工資實(shí)時(shí)標(biāo)簽等多個(gè)場景建設(shè)。

未來展望

湖倉一體實(shí)時(shí)數(shù)倉將數(shù)據(jù)湖的靈活性、數(shù)據(jù)多樣性、豐富生態(tài)與數(shù)據(jù)倉庫的企業(yè)級數(shù)據(jù)分析能力進(jìn)行了融合，對實(shí)時(shí)數(shù)據(jù)模型建設(shè)具有重要價(jià)值。未來，隨著農(nóng)行數(shù)據(jù)湖建設(shè)，實(shí)時(shí)數(shù)倉將融合數(shù)據(jù)湖基礎(chǔ)底座建設(shè)，構(gòu)建穩(wěn)定、全面、高擴(kuò)展性的實(shí)時(shí)數(shù)據(jù)基礎(chǔ)層，建設(shè)和沉淀農(nóng)行共性實(shí)時(shí)數(shù)據(jù)資產(chǎn)，滿足不同實(shí)時(shí)分析應(yīng)用用數(shù)要求。實(shí)時(shí)數(shù)倉基于流批一體數(shù)據(jù)集成，提升數(shù)據(jù)加工時(shí)效性，促進(jìn)全行實(shí)時(shí)分析型應(yīng)用架構(gòu)的統(tǒng)一，對實(shí)時(shí)場景建設(shè)支撐等具有重要意義。

持續(xù)穩(wěn)定的實(shí)時(shí)數(shù)據(jù)供給

實(shí)時(shí)數(shù)倉基于湖的平臺化實(shí)時(shí)集成能力，可以實(shí)現(xiàn)對豐富的實(shí)時(shí)流數(shù)據(jù)集成，降低各類實(shí)時(shí)應(yīng)用實(shí)時(shí)數(shù)據(jù)集成建設(shè)成本；同時(shí)依托數(shù)據(jù)湖流批一體存儲特性，以實(shí)現(xiàn)時(shí)間旅行等一些新特性，滿足可靠性要求等場景，比如某個(gè)時(shí)間端實(shí)時(shí)數(shù)據(jù)的重放處理等等。

豐富的實(shí)時(shí)數(shù)據(jù)模型資產(chǎn)

實(shí)時(shí)數(shù)倉統(tǒng)籌供給共性的實(shí)時(shí)數(shù)據(jù)模型資產(chǎn)，避免了各實(shí)時(shí)應(yīng)用端到端的重復(fù)加工。比如基于明細(xì)層模型，運(yùn)營可以獲取到機(jī)構(gòu)級的匯總結(jié)果，營銷可以匯總到產(chǎn)品級的結(jié)果等等，而各自無需對明細(xì)處理，實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)的一口出。

開放的多租戶能力建設(shè)

數(shù)據(jù)湖倉租戶依托數(shù)據(jù)湖統(tǒng)一存算底座，低成本拎包入住，實(shí)現(xiàn)資源申配、實(shí)時(shí)數(shù)據(jù)授權(quán)、資產(chǎn)發(fā)現(xiàn)，利用實(shí)時(shí)數(shù)倉持續(xù)實(shí)時(shí)數(shù)據(jù)、共性模型供給，并結(jié)合數(shù)據(jù)湖一站式DataOps標(biāo)準(zhǔn)化工藝，無需數(shù)據(jù)出湖，提升數(shù)據(jù)加工時(shí)效，滿足實(shí)時(shí)應(yīng)用場景快速落地，實(shí)現(xiàn)數(shù)據(jù)湖價(jià)值最大化。

責(zé)任編輯：龐桂玉來源：數(shù)字化助推器

數(shù)字化轉(zhuǎn)型湖倉一體

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<pre id="shdou"><source id="shdou"></source></pre>

<em id="shdou"></em>