BI和數(shù)據(jù)倉(cāng)庫(kù):企業(yè)分析決策真的離不開數(shù)據(jù)倉(cāng)庫(kù)嗎?
很長(zhǎng)一段時(shí)間,BI和數(shù)據(jù)倉(cāng)庫(kù)幾乎都是如影隨形、難舍難分。企業(yè)如果想要實(shí)行“數(shù)據(jù)驅(qū)動(dòng)決策-決策推動(dòng)業(yè)務(wù)發(fā)展”的機(jī)制,就必須先有數(shù)據(jù)倉(cāng)庫(kù)充當(dāng)中央存儲(chǔ)庫(kù),供BI查詢和調(diào)取,然后再在BI上進(jìn)行數(shù)據(jù)的分析與可視化。
但數(shù)據(jù)分析和商業(yè)決策發(fā)展至今,企業(yè)想要實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)決策,是否還是無法繞過數(shù)據(jù)倉(cāng)庫(kù)?在現(xiàn)代商業(yè)環(huán)境中重新定義BI和數(shù)據(jù)倉(cāng)庫(kù),我們又能不能找到合適的替代方案?
今天,我們就這個(gè)命題展開討論,希望能給大家提供一些思路。
數(shù)倉(cāng):BI背后的引擎(或管道)
數(shù)據(jù)倉(cāng)庫(kù):從字面意義上即數(shù)據(jù)的倉(cāng)庫(kù),是為了把操作型數(shù)據(jù)集成到統(tǒng)一的環(huán)境中,以提供決策型數(shù)據(jù)訪問。數(shù)據(jù)倉(cāng)庫(kù)關(guān)注的是解決數(shù)據(jù)一致性,可信性,集合性.......這些問題,把越來越復(fù)雜的業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)化成對(duì)于業(yè)務(wù)運(yùn)營(yíng)、業(yè)務(wù)分析來說簡(jiǎn)單易用的數(shù)據(jù)形式;數(shù)據(jù)倉(cāng)庫(kù)的終極目標(biāo)是讓數(shù)據(jù)應(yīng)用人員(無論是CEO還是普通分析師)思考怎么使用數(shù)據(jù)倉(cāng)庫(kù)里的這些數(shù)據(jù),創(chuàng)造更多的信息與價(jià)值;而不是發(fā)愁數(shù)據(jù)在哪里,數(shù)據(jù)對(duì)不對(duì)。
BI(商業(yè)智能):BI是分析數(shù)據(jù)并獲取洞察力、從而幫助企業(yè)做出決策的一系列方法、技術(shù)和軟件。相比數(shù)據(jù)倉(cāng)庫(kù),BI中還包含了數(shù)據(jù)挖掘,數(shù)據(jù)可視化,多維分析,標(biāo)簽分類等方面。拿多維分析舉個(gè)例子,數(shù)據(jù)倉(cāng)庫(kù)中只是提供了維度化的數(shù)據(jù),但是基于某些工具,比如Ebay的kylen或者IBM的Cognos等,可以支持用戶在一定范圍內(nèi)任意組合維度與指標(biāo),那這就上升到了決策支持的層面而不是“高級(jí)數(shù)據(jù)倉(cāng)儲(chǔ)”層面了,也就是使用了數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù),但不是數(shù)據(jù)倉(cāng)庫(kù)的功能。
傳統(tǒng)BI項(xiàng)目的構(gòu)建路徑?jīng)Q定了其必須依賴數(shù)據(jù)倉(cāng)庫(kù)才能進(jìn)行數(shù)據(jù)分析。比如MicroStrategy,SAP BW,微軟 Analysis Server, IBM的Cognos,Oracle的OBIEE,這些傳統(tǒng)BI工具不具備使數(shù)據(jù)集成標(biāo)準(zhǔn)化的能力,數(shù)據(jù)倉(cāng)庫(kù)的存在就是幫助他們建立數(shù)據(jù)治理結(jié)構(gòu),解決數(shù)據(jù)冗余、不一致、錯(cuò)誤、無法輕松訪問等問題。
另一方面,BI對(duì)數(shù)據(jù)倉(cāng)庫(kù)的這種依賴其實(shí)存在著極大的缺陷。一般來說,數(shù)據(jù)倉(cāng)庫(kù)通常需要花費(fèi)高經(jīng)濟(jì)成本、時(shí)間成本從規(guī)劃到落地,但創(chuàng)造的價(jià)值大多數(shù)情況比較有限,ROI較低。搭建成功后,數(shù)據(jù)倉(cāng)庫(kù)也僅支持極少數(shù)特定類型的分析,如果企業(yè)業(yè)務(wù)出現(xiàn)調(diào)整或者需要處理新類型的數(shù)據(jù),屆時(shí)又將重新面臨重大的開發(fā)工作。
從現(xiàn)代商業(yè)決策視角,重新審視BI與數(shù)據(jù)倉(cāng)庫(kù)的關(guān)系
在如今轉(zhuǎn)向服務(wù)導(dǎo)向架構(gòu)(SOA)(*由Gartner提出,以“服務(wù)”為基本元素來組建企業(yè)IT架構(gòu)的方式。SOA要解決的主要問題是:快速構(gòu)建與應(yīng)用集成,現(xiàn)已成為解決企業(yè)業(yè)務(wù)發(fā)展需求與企業(yè)IT支持能力之間矛盾的最佳方案。)的技術(shù)大背景中,耗費(fèi)巨大心力進(jìn)行大規(guī)模的數(shù)據(jù)整合和數(shù)據(jù)集成操作是否還有必要?構(gòu)建數(shù)倉(cāng)的收益是否能大于你將付出的成本?
再加上企業(yè)數(shù)據(jù)體量不斷提升,業(yè)務(wù)發(fā)展越來越迅速,對(duì)快速印證分析決策也提出了更高要求,更多的企業(yè)希望能夠降低技術(shù)設(shè)施成本,做到近乎實(shí)時(shí)地訪問操作源數(shù)據(jù),在極短的時(shí)間內(nèi)響應(yīng)用戶請(qǐng)求。
于是我們看到了越來越多沒有數(shù)倉(cāng)的BI項(xiàng)目。一方面,敏捷BI的興起,允許用戶快速接入各類數(shù)據(jù)源,無需借助數(shù)倉(cāng)即可實(shí)現(xiàn)數(shù)據(jù)導(dǎo)入-處理-分析的流程。而另一方面,新一代AI+BI智能數(shù)據(jù)分析平臺(tái),則在快速接入、敏捷分析的基礎(chǔ)上,實(shí)現(xiàn)了更進(jìn)一步的應(yīng)用:
- 自帶輕量的分布式數(shù)據(jù)存儲(chǔ)與數(shù)據(jù)流處理模塊,提供從數(shù)據(jù)抽取、數(shù)據(jù)建模、數(shù)據(jù)分析,到數(shù)據(jù)可視化、預(yù)警分發(fā)的一站式數(shù)據(jù)分析應(yīng)用能力;
- 即便不抽取數(shù)據(jù),也可實(shí)現(xiàn)多數(shù)據(jù)源的聯(lián)邦動(dòng)態(tài)分析(聯(lián)動(dòng)、鉆取、動(dòng)態(tài)參數(shù)等交互分析功能)。
在這個(gè)角度上來看,一定程度上可以在沒有數(shù)據(jù)倉(cāng)庫(kù)的前提下實(shí)現(xiàn)智能數(shù)據(jù)分析,但是,這僅限于數(shù)據(jù)量有限的中小型企業(yè),不意味著我們推薦直接拿數(shù)據(jù)分析平臺(tái)上的數(shù)據(jù)存儲(chǔ)當(dāng)做數(shù)據(jù)倉(cāng)庫(kù)來用。
因?yàn)殡S著企業(yè)用戶數(shù)據(jù)量、分析復(fù)雜度的不斷提升,數(shù)據(jù)分析平臺(tái)上輕量式數(shù)據(jù)存儲(chǔ)與數(shù)據(jù)流處理模塊是難以承受巨大的計(jì)算壓力的,從企業(yè)長(zhǎng)遠(yuǎn)發(fā)展的角度上考量,還是需要有計(jì)劃地建設(shè)數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)平臺(tái)。
企業(yè)構(gòu)建分析決策架構(gòu)的敏捷策略
企業(yè)分析決策架構(gòu)的未來前景,取決于業(yè)務(wù)驅(qū)動(dòng)因素以及技術(shù)的發(fā)展方向。如今企業(yè)數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng),對(duì)實(shí)時(shí)分析的需求比以往任何時(shí)候都要強(qiáng)烈,鑒于此,如何兼顧快速落地與高可擴(kuò)展性,有機(jī)結(jié)合數(shù)據(jù)倉(cāng)庫(kù)來構(gòu)建企業(yè)分析決策架構(gòu),仍是擺在眾多企業(yè)面前的一個(gè)巨大難題。
對(duì)此,我們推薦的最佳實(shí)踐是:
- 在數(shù)倉(cāng)尚未搭建或分析思路尚未成型時(shí),直接在BI平臺(tái)內(nèi)快速構(gòu)建分析應(yīng)用,快速反饋、快速迭代,實(shí)現(xiàn)quick win。
- 在分析結(jié)果得到業(yè)務(wù)的印證后,再將數(shù)據(jù)沉淀和復(fù)雜分析邏輯逐步固化到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)平臺(tái)里面實(shí)施,此時(shí)BI平臺(tái)僅擔(dān)負(fù)輕量的數(shù)據(jù)分析與可視化壓力。
我們認(rèn)為,數(shù)據(jù)分析的本質(zhì)是為業(yè)務(wù)發(fā)展、商業(yè)決策而服務(wù),而不是創(chuàng)建一堆無用的可視化圖表。通過以上提到的這種敏捷開發(fā),快速印證,不斷沉淀的過程,將能夠更大程度上確保企業(yè)分析決策架構(gòu)的方向正確,獲得業(yè)務(wù)端的認(rèn)同,驅(qū)動(dòng)業(yè)務(wù)發(fā)展,從而產(chǎn)生真正的商業(yè)價(jià)值。