偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

你真的了解 Htap 嗎?

數(shù)據(jù)庫 其他數(shù)據(jù)庫
既然HTAP負載并不是業(yè)務(wù)系統(tǒng)一定要追求的,那么為什么現(xiàn)在我們隨便看到一個分布式數(shù)據(jù)庫,就一定說自己是HTAP數(shù)據(jù)庫呢?這實際上是和分布式數(shù)據(jù)庫的發(fā)展歷史分不開的。分布式數(shù)據(jù)庫剛剛出現(xiàn)的時候,主要還是為了高并發(fā)的OLTP寫入業(yè)務(wù)。

HTAP是目前數(shù)據(jù)庫領(lǐng)域談得最多的一個詞,也是我們存在最多誤解的詞。曾經(jīng)有一個企業(yè)的IT主管和我說,如果我選一款HTAP數(shù)據(jù)庫產(chǎn)品,是不是我都可以把數(shù)據(jù)倉庫拆了,今后只有在線交易系統(tǒng)和大數(shù)據(jù)平臺就行了。這里面實際上包含了對HTAP的巨大的誤解。HTAP=OLTP+OLAP,上面的這個公式真的成立嗎?今天我們來簡單地了解一下傳統(tǒng)的OLTP和OLAP是什么樣的。 圖片

上面是一個傳統(tǒng)的交易域和數(shù)倉域分離的傳統(tǒng)數(shù)據(jù)倉庫架構(gòu)。大量的在線交易系統(tǒng)首先把數(shù)據(jù)復(fù)制到貼貼源層的ODS,然后經(jīng)過ETL工具加載到數(shù)據(jù)倉庫中,同時數(shù)據(jù)倉庫中還會存儲一些來自外部的數(shù)據(jù),甚至一些外購的數(shù)據(jù)。存儲在數(shù)據(jù)倉庫中的是高價值數(shù)據(jù),經(jīng)過處理后形成一系列的數(shù)據(jù)集市,供業(yè)務(wù)系統(tǒng)使用。這種架構(gòu)中將在線交易與數(shù)據(jù)分析兩種截然不同的負載區(qū)分開來,避免相互干擾。

不過這種架構(gòu)最大的問題是,ETL的延時比較大,很多需要及時分析的業(yè)務(wù)無法得到保證。因此縮短在線交易系統(tǒng)到數(shù)據(jù)倉庫之間的延時就十分重要了。

圖片

Oracle公司推出了一套基于準實時ETL產(chǎn)品ODI的解決方案。生產(chǎn)系統(tǒng)使用ORACLE的交易型數(shù)據(jù)庫模式,通過ODI捕獲生產(chǎn)系統(tǒng)的變化,并通過定義好的轉(zhuǎn)換規(guī)則,準實時進行ETL操作,復(fù)制數(shù)據(jù)到ORACLE OLAP模式的數(shù)據(jù)倉庫中。上面的優(yōu)化模式雖然能解決一部分數(shù)據(jù)倉庫的延時問題,但是對于實時性要求更高的一些業(yè)務(wù)就無法滿足了。

因此在在線交易系統(tǒng)中支撐比較強大的數(shù)據(jù)分析功能的需求就應(yīng)運而生了,這個需求就是HTAP計算模式。不過聰明的朋友可能也看出來了,這種HTAP計算并不等同于在線交易+數(shù)據(jù)倉庫業(yè)務(wù)。因為如果我們要把一個企業(yè)的所有高價值數(shù)據(jù)都存儲在一個數(shù)據(jù)庫里,才能實現(xiàn)這個替代數(shù)據(jù)倉庫的目標。而這種設(shè)計會讓單一的數(shù)據(jù)庫太重了,一旦這個數(shù)據(jù)庫出現(xiàn)一點點問題,可能就會影響整個企業(yè)的業(yè)務(wù),這是我們無法承受的。

企業(yè)需要的HTAP能力不需要完全覆蓋數(shù)據(jù)倉庫業(yè)務(wù),僅僅需要對核心業(yè)務(wù)需要的在線分析能力做一定的提升就可以了。因此在HTAP數(shù)據(jù)庫中需要存儲的就是OLTP系統(tǒng)本身的數(shù)據(jù)以及部分分析必須的從外部提取過來的高價值數(shù)據(jù)。


圖片

上面的圖看上去是不是簡單多了,不過這個簡化了的業(yè)務(wù)需求也并不容易實現(xiàn)。這是因為TP系統(tǒng)跑的是穩(wěn)定,高并發(fā),低延時,大多數(shù)通過索引訪問,大量寫操作的小業(yè)務(wù),對于并發(fā)寫入量較大的表,盡可能減少不必要的索引;而AP系統(tǒng)跑的是隨機性大,資源開銷極大,大部分需要對大表進行并行掃描,持續(xù)時間很長的的以讀為主的分析類業(yè)務(wù)。讀寫操作之間會有相互影響,大量的寫操作希望索引越少越好,而大量的讀操作希望索引越豐富越好。AP操作的臨時性資源開銷可能會導(dǎo)致TP業(yè)務(wù)的延時出現(xiàn)經(jīng)常性的抖動,這些都是會讓TP業(yè)務(wù)無法忍受的。

TP業(yè)務(wù)經(jīng)常需要訪問一張表中的多個字段,從而實現(xiàn)復(fù)雜的業(yè)務(wù)邏輯,因此用行存儲的方式性能最佳。AP業(yè)務(wù)經(jīng)常對某一列的數(shù)據(jù)做掃描分析,因此如果數(shù)據(jù)按列存儲具有較好的性能。這些業(yè)務(wù)之間的矛盾都使一個數(shù)據(jù)庫中承載混合的HTAP負載十分困難。

而實際上,我們的OLTP系統(tǒng)中,真的都需要HTAP工作負載嗎?答案是否定的。大多數(shù)OLTP系統(tǒng)中僅僅需要一定量的批處理負載,用于對數(shù)據(jù)進行一些復(fù)雜的加工。在一個設(shè)計的比較好的OLTP系統(tǒng)中,通過定期自動匯總數(shù)據(jù),物化視圖等方式,可以大幅度減少開銷極大的AP工作負載。只有極少數(shù)的系統(tǒng)是真的必須有復(fù)雜的準實時OLAP需求的。而對于AP的實時性要求,如果通過更實時的數(shù)據(jù)復(fù)制和ETL,大部分問題是可以解決的。

此外,分布式SQL引擎的效率、OLTP/OLAP的資源隔離與防干擾措施、數(shù)據(jù)存儲格式、大型集群管理、讀寫副本的使用方式、主副本切換帶來的性能抖動等都會影響數(shù)據(jù)庫的HTAP能力。

既然HTAP負載并不是業(yè)務(wù)系統(tǒng)一定要追求的,那么為什么現(xiàn)在我們隨便看到一個分布式數(shù)據(jù)庫,就一定說自己是HTAP數(shù)據(jù)庫呢?

這實際上是和分布式數(shù)據(jù)庫的發(fā)展歷史分不開的。分布式數(shù)據(jù)庫剛剛出現(xiàn)的時候,主要還是為了高并發(fā)的OLTP寫入業(yè)務(wù)。因此這些數(shù)據(jù)庫產(chǎn)品的多表關(guān)聯(lián),復(fù)雜分析功能是很弱的。分布數(shù)據(jù)庫廠家也在不斷地優(yōu)化產(chǎn)品,努力提升這方面的能力。因此為了標榜自己的技術(shù)優(yōu)勢,大家都在HTAP能力上開展起軍備競賽了。

雖然如此,如果真的有一個HTAP能力極強的數(shù)據(jù)庫產(chǎn)品放在我們面前,對于用戶和軟件開發(fā)商來說,肯定是一件好事情。這會讓我們的管理系統(tǒng),交易系統(tǒng)的功能變得更加豐富。對于某些行業(yè)的業(yè)務(wù)系統(tǒng)來說,可能會促進業(yè)務(wù)的革命性變革。比如說能源行業(yè)鼓吹了多年的源網(wǎng)核儲互動,因為我們的數(shù)據(jù)處理能力不足,不及時,導(dǎo)致我們在電力生產(chǎn)、消費、儲能、調(diào)度等方面的數(shù)據(jù)無法及時進行處理分析,大大降低了能源的綜合利用率。

目前來說,電是不可大規(guī)模存儲的資源,而且電源側(cè)發(fā)出的電必須平衡的被消耗掉,否則多發(fā)出來的電必須被盡快消耗掉,而某個局部網(wǎng)絡(luò)上的電能不足時,就只能拉閘限電,確保電能在網(wǎng)絡(luò)上整個是平衡的。當電源側(cè)發(fā)電量過大,或者用電需求過大,供給不足或者電力調(diào)度不及時,導(dǎo)致用電缺口達到一定程度的時候,電網(wǎng)會因為不平衡而解裂,2013年洛杉磯大停電或者前幾年美國德州大停電的慘劇就會重演了。

我們國家這些年沒有出現(xiàn)過類似的情況,這說明我國的大電網(wǎng)調(diào)度運營水平是很高的。不過這種水平很高并不意味著很高效。我們的電網(wǎng)調(diào)度十分依賴于相對穩(wěn)定的電源,比如火力發(fā)電。而水電、光伏、風能這些清潔能源因為其不穩(wěn)定,會大大加大電網(wǎng)調(diào)度的難度。因此目前我國棄風棄光的比例一直是高于西方發(fā)達國家的。

為了完成碳中和目標,加大清潔能源供給是必然的,因此源網(wǎng)核儲互動能力的提升十分關(guān)鍵。而要提升源網(wǎng)核儲互動的效率,精準及時的數(shù)據(jù)采集與數(shù)據(jù)分析是關(guān)鍵。我們必須提高電能表采集的頻率(歐洲最先進的電網(wǎng)計量已經(jīng)實現(xiàn)了5分鐘全量采集,而我們目前的主流水平還只是重點電表15分鐘間隔采集),提升與發(fā)電企業(yè)之間的數(shù)據(jù)交換的水平,對氣候、社會熱點、制造業(yè)增長態(tài)勢、外貿(mào)等數(shù)據(jù)進行更廣泛的采集與處理分析,這樣才能逐步提升電網(wǎng)調(diào)度計劃的水平。以目前電能采集系統(tǒng)到大數(shù)據(jù)平臺數(shù)據(jù)復(fù)制的一天時延來看,要實現(xiàn)這個任務(wù)是幾乎不可能的。

具有強大HTAP處理能力的數(shù)據(jù)庫是解決這個計算難題的十分關(guān)鍵的IT基礎(chǔ)設(shè)施,這是一個十分現(xiàn)實的HTAP計算場景。十分可惜的是,在我們?yōu)檫@個場景選擇數(shù)據(jù)庫產(chǎn)品的時候,還沒有找到一款國產(chǎn)數(shù)據(jù)庫產(chǎn)品具備處理這個業(yè)務(wù)場景的能力。

其他行業(yè)中,也可以找出很多類似這樣的計算場景,在提升企業(yè)效率,降低企業(yè)成本的業(yè)務(wù)創(chuàng)新中,這種需求也會越來越多。因此數(shù)據(jù)庫產(chǎn)品發(fā)展HTAP能力是十分重要的。只是說,目前我們的國產(chǎn)數(shù)據(jù)庫的HTAP能力建設(shè)還處于初級階段,目前大多數(shù)國產(chǎn)數(shù)據(jù)庫能夠提供的HTAP能力大部分可以通過業(yè)務(wù)系統(tǒng)優(yōu)化來避開,而真正對HTAP強需求的場景,我們的產(chǎn)品的支撐能力還略顯不足。

責任編輯:武曉燕 來源: 白鱔的洞穴
相關(guān)推薦

2014-04-17 16:42:03

DevOps

2014-11-28 10:31:07

Hybrid APP

2020-02-27 10:49:26

HTTPS網(wǎng)絡(luò)協(xié)議TCP

2019-09-16 08:40:42

2023-03-16 10:49:55

2021-01-15 07:44:21

SQL注入攻擊黑客

2021-11-09 09:48:13

Logging python模塊

2025-01-03 08:09:15

2024-02-02 08:50:20

Node.js元數(shù)據(jù)自動化

2012-05-31 09:56:54

云安全

2023-10-24 08:53:24

FutureTas并發(fā)編程

2017-10-18 22:01:12

2019-11-06 09:52:01

JavaScript單線程非阻塞

2022-12-12 08:46:11

2022-03-14 07:53:27

ELTETL大數(shù)據(jù)

2015-07-31 10:35:18

實時計算

2016-11-02 12:06:27

分布式系統(tǒng)大數(shù)據(jù)

2023-05-10 11:07:18

2018-01-06 10:38:51

Ping抓包 ICMP協(xié)議

2016-01-13 10:34:57

物聯(lián)網(wǎng)物聯(lián)網(wǎng)技術(shù)
點贊
收藏

51CTO技術(shù)棧公眾號