國(guó)產(chǎn)關(guān)系型數(shù)據(jù)庫(kù)大調(diào)查
隨著信創(chuàng)改造的深化及國(guó)產(chǎn)軟件興起,越來(lái)越多的國(guó)產(chǎn)數(shù)據(jù)庫(kù)受到大家的關(guān)注。近期看到網(wǎng)上幾篇關(guān)于國(guó)產(chǎn)數(shù)據(jù)庫(kù)代碼起源、開(kāi)源情況的文章很火,想必廣大企業(yè)用戶也很關(guān)注這些問(wèn)題。下文從墨天輪社區(qū)及各數(shù)據(jù)庫(kù)廠商官網(wǎng)收集信息,共收錄國(guó)產(chǎn)關(guān)系型數(shù)據(jù)庫(kù)165家;對(duì)信息分析供參考。
? 部分廠家產(chǎn)品采用單一品牌多款產(chǎn)品形式,統(tǒng)計(jì)時(shí)會(huì)拆分處理。
1. 大調(diào)查:總覽篇
1).流行度
墨天輪社區(qū)提供了流行度評(píng)分,其計(jì)算方式是參考搜索引擎、趨勢(shì)指數(shù)、三方評(píng)測(cè)、生態(tài)(社區(qū)、高校合作、培訓(xùn)認(rèn)證等)情況、專利數(shù)、論文數(shù)、招聘崗位數(shù)、書(shū)籍搜索量、海外機(jī)構(gòu)排名(Gartner、IDC)綜合得到的分?jǐn)?shù)。從上述評(píng)分可以反映產(chǎn)品流行程度。從下圖反映的情況來(lái)看,頭部聚集效應(yīng)凸顯,前十名的產(chǎn)品流行度總體占比超72%,前二十名產(chǎn)品的流行度總體占比超82%。
2).地域分布
從地區(qū)分布來(lái)看,頭部效應(yīng)更加明顯。北京占比最高,在收集的165家企業(yè)中,超半數(shù)坐落于北京;深圳、上海、杭州也聚集部分廠商。企業(yè)地域聚集現(xiàn)象,一方面與人才市場(chǎng)因素有關(guān),一方面也是很多數(shù)據(jù)庫(kù)企業(yè)來(lái)自于互聯(lián)網(wǎng)或傳統(tǒng)行業(yè)大廠,與這些大廠分布也有關(guān)。
如果加上數(shù)據(jù)庫(kù)流行度評(píng)分,各地域的差異就沒(méi)那么明顯,深圳、杭州表現(xiàn)突出,武漢和天津則有幾個(gè)排名靠前的數(shù)據(jù)庫(kù)頭部廠商。
3).使用場(chǎng)景
傳統(tǒng)數(shù)據(jù)庫(kù)的使用場(chǎng)景,主要分為OLTP和OLAP。如今,更多細(xì)化的場(chǎng)景沒(méi)提出,如近年比較火的HTAP。很多數(shù)據(jù)庫(kù)產(chǎn)品是可以滿足多種場(chǎng)景,統(tǒng)計(jì)中按照支持場(chǎng)景進(jìn)行分類。如單產(chǎn)品支持多場(chǎng)景或有細(xì)分產(chǎn)品滿足此場(chǎng)景,會(huì)單獨(dú)統(tǒng)計(jì)。從下左圖可見(jiàn),OLTP仍然是主流場(chǎng)景,OLAP次之,HTAP也作為很多新產(chǎn)品主打的理念。如果在疊加上流行度因素,如下右圖可見(jiàn),支持HTAP產(chǎn)品的流行度明顯較高。也就是說(shuō)越來(lái)越多的頭部廠商也將支持HTAP場(chǎng)景作為其主流使用場(chǎng)景之一。
4).開(kāi)發(fā)模式
隨著開(kāi)源理念逐步被廣泛接受,正有越來(lái)越多的產(chǎn)品選擇開(kāi)源模式運(yùn)作。從左圖可見(jiàn),大部分廠商采用商業(yè)開(kāi)發(fā)模式,開(kāi)源模式還僅占少數(shù)。但如果考慮到流行度的問(wèn)題,情況則大不同。參考右圖,疊加上流行度因素可見(jiàn),開(kāi)源占比已接近商業(yè),也就是說(shuō)頭部的廠商更多采用開(kāi)源策略。這也與其流行度較高有著密不可分的關(guān)系。
2. 大調(diào)查:技術(shù)篇
1).技術(shù)架構(gòu)
從技術(shù)架構(gòu)演進(jìn)來(lái)看,數(shù)據(jù)庫(kù)走過(guò)了單機(jī)式、集中式到分布式的發(fā)展,目前是多種架構(gòu)并存的階段。分布式架構(gòu)以其更好的擴(kuò)展能力,受到更多的關(guān)注。當(dāng)然我們也需要意識(shí)到,分布式因其架構(gòu)特點(diǎn)決定,會(huì)失去一些傳統(tǒng)架構(gòu)的優(yōu)點(diǎn)。而對(duì)于大部分場(chǎng)景來(lái)說(shuō),集中式甚至單機(jī)架構(gòu)就可以滿足。從下圖可見(jiàn),兩種架構(gòu)產(chǎn)品處于均分的狀態(tài),甚至分布式稍占優(yōu)。
從場(chǎng)景上來(lái)看,不同場(chǎng)景的架構(gòu)占比還有所不同。對(duì)于OLAP、HTAP等領(lǐng)域,因其承載數(shù)據(jù)規(guī)模及算力更大,分布式產(chǎn)品更有優(yōu)勢(shì),因而分布式也會(huì)占比更高。
2).部署環(huán)境
從部署環(huán)境來(lái)看,本地部署與云原生環(huán)境并存。多款產(chǎn)品支持在兩種環(huán)境中部署。但從整體來(lái)看,仍然是以本地部署方式為主,云原生的部署方式占少數(shù),如左圖。從技術(shù)架構(gòu)來(lái)看,分布式更容易利用云原生提供的計(jì)算與存儲(chǔ)能力,因此更多地支持云原生部署,如右圖。
3).代碼來(lái)源
作為基礎(chǔ)軟件之一,數(shù)據(jù)庫(kù)需要較大的代碼工程量。在這其中,完全自研還是利用開(kāi)源產(chǎn)品快速構(gòu)建是兩類思路。如下圖來(lái)看,從數(shù)量來(lái)說(shuō),獨(dú)立自研產(chǎn)品仍然占多數(shù)(其中有些產(chǎn)品未明確聲明基于開(kāi)源構(gòu)建,因而算為自研)?;陂_(kāi)源構(gòu)建來(lái)說(shuō),MySQL和PG是作為流行的兩款開(kāi)源數(shù)據(jù)庫(kù)產(chǎn)品,大量的商業(yè)產(chǎn)品基于其開(kāi)發(fā)。值得關(guān)注的是排名第三的openGauss,作為一款國(guó)人開(kāi)源的數(shù)據(jù)庫(kù)產(chǎn)品,眾多商業(yè)產(chǎn)品基于其構(gòu)建值得祝賀。
如果從另一個(gè)角度流行度來(lái)看,基于PG構(gòu)建產(chǎn)品的總流行度要超過(guò)基于MySQL構(gòu)建的產(chǎn)品。但這里有個(gè)特殊情況,有些登記的產(chǎn)品是單一品牌多款數(shù)據(jù)庫(kù),但流行度評(píng)分是一個(gè),存在一定的偏差。
4).兼容性
數(shù)據(jù)庫(kù)兼容能力,是快速獲得用戶的關(guān)鍵,特別是一款新產(chǎn)品。之前國(guó)內(nèi)數(shù)據(jù)庫(kù)市場(chǎng)以海外大型商用數(shù)據(jù)庫(kù)為主,其占據(jù)了很大的份額,構(gòu)建了完整生態(tài)。作為國(guó)內(nèi)產(chǎn)品如果想快速被用戶接受,兼容其他擁有較好生態(tài)產(chǎn)品是個(gè)不錯(cuò)的做法。從下圖可見(jiàn),MySQL作為最為流行的開(kāi)源數(shù)據(jù)庫(kù),也成為眾多廠商首選的兼容對(duì)象,其次是PG和Oracle。
如果我們考慮流行度因素來(lái)看兼容性占比,則MySQL仍然為第一,但Oracle、PG整體也占比很高,特別是Oracle成為接近MySQL的第二兼容選擇。