當(dāng)商業(yè)智能遇上大數(shù)據(jù)
時(shí)下大數(shù)據(jù)大熱,而且這股熱潮可謂來(lái)勢(shì)洶洶。在相關(guān)廠商、投資方以及眾多第三方機(jī)構(gòu)的鼓動(dòng)下,越來(lái)越多的用戶摩拳擦掌、躍躍欲試。
雖然眼下各家關(guān)于大數(shù)據(jù)的宣傳重點(diǎn)各有不同,但描繪的前景基本相同,即通過(guò)數(shù)據(jù)探查、數(shù)據(jù)分析及數(shù)據(jù)展示等相關(guān)技術(shù),讓我們可以從海量數(shù)據(jù)中很快找到新的商業(yè)機(jī)會(huì),或者做出更正確的決策。
對(duì)IT業(yè)發(fā)展歷史有些了解者對(duì)這一情形并不陌生,當(dāng)年商業(yè)智能也是同樣炙手可熱,而且商業(yè)智能也是以“打開(kāi)智慧之門(mén)”的名義讓不少企業(yè)投入其中,而時(shí)至今日,很少有企業(yè)真正拿到了那把“金鑰匙”。
如今,當(dāng)兩個(gè)同樣以“智能”或者“智慧”名義敲開(kāi)用戶大門(mén)的技術(shù)來(lái)到我們面前的時(shí)候,我們?cè)撊绾芜x擇?特別是對(duì)于傳統(tǒng)商業(yè)智能的用戶,我們?cè)撊绾畏e極擁抱大數(shù)據(jù)?有了大數(shù)據(jù)我們還需要商業(yè)智能嗎?大數(shù)據(jù)將取代傳統(tǒng)商業(yè)智能嗎?
在大數(shù)據(jù)聲名鵲起而傳統(tǒng)商業(yè)智能聲音似乎逐漸式微的當(dāng)下,我們提出這些問(wèn)題并非毫無(wú)來(lái)由。盡管目前關(guān)于何謂大數(shù)據(jù)還沒(méi)有統(tǒng)一的說(shuō)法,但是,大數(shù)據(jù)是以海量數(shù)據(jù)的處理和分析,發(fā)現(xiàn)數(shù)據(jù)背后的本質(zhì),增加企業(yè)洞察力為目的而誕生的,而這與商業(yè)智能的目的基本一致,從這個(gè)意義上說(shuō),兩者之間就存在著一定的競(jìng)爭(zhēng)關(guān)系。當(dāng)我們把“大數(shù)據(jù)是否將取代傳統(tǒng)商業(yè)智能”話題發(fā)布在《計(jì)算機(jī)世界》官方微博和計(jì)世網(wǎng)上的時(shí)候,的確引起了業(yè)界的廣泛探討(微博調(diào)查結(jié)果參見(jiàn)圖1)。這在一定程度上也反映了業(yè)界對(duì)大數(shù)據(jù)與商業(yè)智能之間關(guān)系的模糊認(rèn)識(shí)。
#p#
草根與貴族之爭(zhēng)
盡管隨著技術(shù)的不斷進(jìn)步,商業(yè)智能日益平民化,如今基于Excel表也能在一定程度上實(shí)現(xiàn)傳統(tǒng)商業(yè)智能的部分功能。但是,商業(yè)智能最精典的架構(gòu)依然以數(shù)據(jù)倉(cāng)庫(kù)為基礎(chǔ),通過(guò)搭建數(shù)據(jù)倉(cāng)庫(kù)(常常是專(zhuān)用設(shè)備),利用ETL工具進(jìn)行數(shù)據(jù)抽取、轉(zhuǎn)化,建模,然后通過(guò)報(bào)表和駕駛艙等形式進(jìn)行結(jié)果展示,整個(gè)過(guò)程每個(gè)環(huán)節(jié)都投資不菲而且耗時(shí)。因此,很長(zhǎng)時(shí)間以來(lái),商業(yè)智能被認(rèn)為大企業(yè)的專(zhuān)有,而被稱(chēng)為是貴族。相對(duì)而言,大數(shù)據(jù)主要用于一些互聯(lián)網(wǎng)企業(yè),采用通用硬件設(shè)備加上開(kāi)源軟件實(shí)現(xiàn),成本低而被一些人認(rèn)為是草根。因此,這場(chǎng)大數(shù)據(jù)與商業(yè)智能之爭(zhēng)也被看成是“草根”與“貴族”之爭(zhēng)。那么,當(dāng)“草根”出身的大數(shù)據(jù)遇到了“貴族”商業(yè)智能會(huì)發(fā)生什么變化?是否會(huì)搶占商業(yè)智能的市場(chǎng)?
“目前看來(lái),大數(shù)據(jù)還搶不了商業(yè)智能的市場(chǎng),無(wú)論從技術(shù)成熟度還是生態(tài)系統(tǒng)來(lái)說(shuō)。”SAP亞太區(qū)數(shù)據(jù)庫(kù)解決方案技術(shù)總監(jiān)盧東明告訴計(jì)算機(jī)世界記者,商業(yè)智能這個(gè)概念自1992年興起后的20多年中,已經(jīng)在IT界幾乎家喻戶曉、婦孺皆知了。這個(gè)概念的知名度是一個(gè)巨大的資產(chǎn),顛覆一個(gè)已有20多年存在且仍有生命力的技術(shù)是非常不容易而緩慢的過(guò)程。
而就生態(tài)系統(tǒng)而言,歷經(jīng)近20年的發(fā)展,商業(yè)智能從最初朦朧的概念到如今豐富的產(chǎn)品系列和解決方案組合,特別是數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品的組合在用戶中已經(jīng)留下很深的烙印。此外,還有各種各樣圍繞商業(yè)智能產(chǎn)生的數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析、數(shù)據(jù)可視化軟件,如此完善的生態(tài)系統(tǒng)是現(xiàn)階段大數(shù)據(jù)所無(wú)法媲美的。
基于上述原因,盧東明更愿意把大數(shù)據(jù)作為傳統(tǒng)數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)以及商業(yè)智能這些概念的外延和擴(kuò)展,認(rèn)為相互之間不存在取代的關(guān)系,也并不是互斥的關(guān)系,他傾向于把大數(shù)據(jù)歸為實(shí)現(xiàn)商業(yè)智能的一種技術(shù)手段。“打個(gè)比方吧:如果BI是個(gè)聽(tīng)診器的話,你說(shuō)X光、核磁共振和它啥關(guān)系?”
實(shí)際上,在我們的微博調(diào)查中,持類(lèi)似觀點(diǎn)的基本占絕大多數(shù),特別是業(yè)內(nèi)人士。北京殷塞信息技術(shù)有限公司執(zhí)行董事兼***架構(gòu)師朱東也是其中之一,在朱東看來(lái),大數(shù)據(jù)就是一種分布式存儲(chǔ)和處理技術(shù),用來(lái)處理那些“分散”和“難處理的數(shù)據(jù)”,和商業(yè)智能不在一個(gè)層面上,本質(zhì)上大數(shù)據(jù)只是商業(yè)智能的一個(gè)新數(shù)據(jù)源。從這一點(diǎn)上也反映出業(yè)界對(duì)大數(shù)據(jù)的概念至今還缺乏統(tǒng)一的認(rèn)識(shí)。(本文所說(shuō)的大數(shù)據(jù)是廣義的大數(shù)據(jù),涵蓋對(duì)海量數(shù)據(jù)特別是非結(jié)構(gòu)化數(shù)據(jù)從數(shù)據(jù)采集、存儲(chǔ)、分析到最終結(jié)果呈現(xiàn)的整個(gè)過(guò)程中涉及的所有技術(shù)。正是基于此,這兩個(gè)概念才有可比性。)
當(dāng)然,也有人不這么看。特別是在一些用戶看來(lái),兩者的關(guān)系可能就簡(jiǎn)單得多了。
“從用戶觀點(diǎn)看,只有草根打法和貴族打法的差別,沒(méi)有大數(shù)據(jù)和BI的差別。”中文信息處理及金融IT知名專(zhuān)家、上海證券交易所白碩在其微博中也對(duì)我們提出的“大數(shù)據(jù)將取代傳統(tǒng)商業(yè)智能”的話題發(fā)表了自己的意見(jiàn)。#p#
跑在不同軌道上的列車(chē)
拋開(kāi)商業(yè)智能與大數(shù)據(jù)之間的爭(zhēng)論不談,目前這兩者各自都有其擅長(zhǎng)的領(lǐng)域則是不爭(zhēng)的事實(shí),而且看起來(lái)區(qū)別實(shí)在太大,更像是偶有交叉但行駛在不同軌道上的兩輛列車(chē)。
眾所周知,當(dāng)今的數(shù)據(jù)資產(chǎn)基本可以歸為三類(lèi),即企業(yè)內(nèi)部的業(yè)務(wù)數(shù)據(jù)、公共服務(wù)機(jī)構(gòu)的數(shù)據(jù)(如物聯(lián)網(wǎng)相關(guān)數(shù)據(jù)),以及與互聯(lián)網(wǎng)相關(guān)的數(shù)據(jù)(如網(wǎng)絡(luò)日志、微博等)。
“在這三類(lèi)數(shù)據(jù)中,企業(yè)內(nèi)部業(yè)務(wù)數(shù)據(jù)和部分公共服務(wù)器的分析和處理基本是傳統(tǒng)商業(yè)智能的天下,而互聯(lián)網(wǎng)數(shù)據(jù)的處理則是大數(shù)據(jù)技術(shù)的天下。兩者的重合度并不大。”Informatica中國(guó)區(qū)***產(chǎn)品顧問(wèn)介紹說(shuō)。
南大通用數(shù)據(jù)技術(shù)有限公司董事長(zhǎng)助理李航表達(dá)了同樣的觀點(diǎn)。他認(rèn)為,大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)到目前為止還是涇渭分明的兩個(gè)不同陣營(yíng),現(xiàn)實(shí)中絕大部分企業(yè)的商業(yè)分析都基于傳統(tǒng)的商業(yè)智能來(lái)進(jìn)行,還不會(huì)因?yàn)榇髷?shù)據(jù)而摒棄原來(lái)的傳統(tǒng)分析方法。因此,不存在所謂的市場(chǎng)沖擊。
“大數(shù)據(jù)相關(guān)技術(shù)(如Hadoop)主要用來(lái)存儲(chǔ)和處理非結(jié)構(gòu)化數(shù)據(jù),但是非結(jié)構(gòu)化的數(shù)據(jù)想要被充分認(rèn)知和分析,轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)之后處理不失為一種有效方法。比如,將大數(shù)據(jù)以及聚合數(shù)據(jù)輸入傳統(tǒng)商業(yè)智能系統(tǒng)中去做分析與展現(xiàn),最終形成報(bào)告,出分析結(jié)果。”李航說(shuō)。
李航的觀點(diǎn)在傳統(tǒng)數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)廠商從業(yè)人士中很典型,基本代表了大多數(shù)傳統(tǒng)傳統(tǒng)數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)廠商的觀點(diǎn)。基于這樣的認(rèn)識(shí),它們最常推薦的一個(gè)應(yīng)用場(chǎng)景是,將大數(shù)據(jù)存儲(chǔ)在Hadoop,利用Hadoop來(lái)初步處理,然后將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)數(shù)據(jù)倉(cāng)庫(kù)中,再利用現(xiàn)有的傳統(tǒng)商業(yè)智能平臺(tái)進(jìn)行數(shù)據(jù)分析和預(yù)測(cè),提供報(bào)表,或者成為企業(yè)駕駛艙中的一部分。而那些率先引入大數(shù)據(jù)技術(shù)的互聯(lián)網(wǎng)企業(yè)卻很少使用這些方法,這些缺乏傳統(tǒng)商業(yè)智能基礎(chǔ)的企業(yè)從一開(kāi)始就將自己的解決方案完全架構(gòu)在Hadoop等大數(shù)據(jù)技術(shù)上,直接從Hadoop中提出數(shù)據(jù),利用自己定制的MapReduce,完成數(shù)據(jù)的分析和展現(xiàn)。比如,提供網(wǎng)站精準(zhǔn)推薦服務(wù)的百分點(diǎn)就是這樣使用Hadoop挖掘訪客點(diǎn)擊數(shù)據(jù)的。
顯然,用戶不同的技術(shù)儲(chǔ)備決定了技術(shù)方案的不同選擇,而廠商不同的出身也決定了其不同技術(shù)發(fā)展路線。在傳統(tǒng)商業(yè)智能廠商看來(lái),商業(yè)智能和大數(shù)據(jù)都不可偏廢。IBM新興市場(chǎng)部大數(shù)據(jù)中心總監(jiān)王曉梅就多次強(qiáng)調(diào),在IBM大數(shù)據(jù)的戰(zhàn)略中,傳統(tǒng)的關(guān)系型數(shù)據(jù)、結(jié)構(gòu)化的數(shù)據(jù)仍舊是IBM大數(shù)據(jù)中非常重要的一部分,其數(shù)據(jù)倉(cāng)庫(kù)也仍舊是整個(gè)大數(shù)據(jù)平臺(tái)不可或缺的重要一部分。#p#
技術(shù)上的融合
盡管在大多數(shù)業(yè)內(nèi)人士看來(lái),在數(shù)據(jù)分析市場(chǎng)上大數(shù)據(jù)與商業(yè)智能更像兩個(gè)行駛在不同軌道上的列車(chē),并肩前行同時(shí)偶有交叉,但是在技術(shù)上,同為數(shù)據(jù)分析、提高洞察力而存在的兩種技術(shù)之間早就開(kāi)始了交流和互動(dòng)。比如,為應(yīng)對(duì)海量數(shù)據(jù)帶來(lái)的挑戰(zhàn),商業(yè)智能相關(guān)產(chǎn)品紛紛在性能方面做文章。內(nèi)存計(jì)算、列式存儲(chǔ)等技術(shù)就被廣泛應(yīng)用到傳統(tǒng)的數(shù)據(jù)處理相關(guān)產(chǎn)品和技術(shù)中,今天我們?cè)贗BM、Oracle、SAP等相關(guān)產(chǎn)品上都可以看到它們的蹤跡。比如,SAP正在大力推廣的HANA就是典型代表。同樣,專(zhuān)注在數(shù)據(jù)分析層面的SAS也在其新一代數(shù)據(jù)分析工具中引入名為HPA的高性能分析引擎,主打的同樣也是高性能。
除此之外,那些提供傳統(tǒng)數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)的主流供應(yīng)商,包括甲骨文、IBM、SAP(收購(gòu)了Sybase)、微軟等都在其數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)提供各種連接器,支持對(duì)Hadoop數(shù)據(jù)進(jìn)行分析。比如,甲骨文推出了軟硬一體的大數(shù)據(jù)庫(kù)機(jī),其中內(nèi)置了與Oracle數(shù)據(jù)庫(kù)的連接器來(lái)與Hadoop進(jìn)行數(shù)據(jù)通信。在SAP Sybase***一代數(shù)據(jù)倉(cāng)庫(kù)Sybase IQ 15.4中也同樣配備了很多接口。通過(guò)這些接口可以同時(shí)訪問(wèn)Sybase IQ和Hadoop,或者用一個(gè)標(biāo)準(zhǔn)的SQL來(lái)訪問(wèn)Hadoop的數(shù)據(jù)。
“適者生存,從結(jié)構(gòu)化為主的‘小數(shù)據(jù)’到非結(jié)構(gòu)化為主的‘大數(shù)據(jù)’,大量連接器的出現(xiàn)其實(shí)已經(jīng)表明了數(shù)據(jù)庫(kù)廠商的姿態(tài),大數(shù)據(jù)擴(kuò)充了數(shù)據(jù)的外延,也擴(kuò)大了數(shù)據(jù)庫(kù)的應(yīng)用空間。目前還沒(méi)有一個(gè)數(shù)據(jù)庫(kù)***地解決‘小數(shù)據(jù)’和‘大數(shù)據(jù)’的混用問(wèn)題,接口就是目前***的階段性技術(shù)。”SAP盧東明告訴計(jì)算機(jī)世界記者,而從技術(shù)發(fā)展的角度看,數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品必須自我發(fā)展,以適應(yīng)大數(shù)據(jù)帶來(lái)的挑戰(zhàn),一如商業(yè)智能的過(guò)去一樣。
眾多周知,在過(guò)去的20多年,傳統(tǒng)商業(yè)智能從行式存儲(chǔ)數(shù)據(jù)庫(kù)轉(zhuǎn)為列式存儲(chǔ)數(shù)據(jù)庫(kù),磁盤(pán)數(shù)據(jù)庫(kù)轉(zhuǎn)向內(nèi)存數(shù)據(jù)庫(kù),軟件架構(gòu)也從SMP轉(zhuǎn)為MPP,數(shù)據(jù)倉(cāng)庫(kù)實(shí)施從延時(shí)多維變?yōu)閷?shí)時(shí)抽取等。這些轉(zhuǎn)變的背后,其推動(dòng)力就是用戶對(duì)數(shù)據(jù)處理和分析日益增加的需求。
相對(duì)于比較成熟的傳統(tǒng)商業(yè)智能,出現(xiàn)不久的大數(shù)據(jù)其需要成長(zhǎng)和完善的地方更多。“效率、可靠性和安全性是一個(gè)成熟的數(shù)據(jù)處理平臺(tái)所必須具備的,對(duì)于大數(shù)據(jù)而言,這也是它首先需要解決的。”Informatica大中國(guó)區(qū)***產(chǎn)品顧問(wèn)但斌告訴計(jì)算機(jī)世界記者,而在這些方面?zhèn)鹘y(tǒng)BI已經(jīng)走過(guò)了近20年的發(fā)展歷程,可以提供很多值得借鑒的技術(shù)和方法論。
另一方面,大數(shù)據(jù)在技術(shù)上也有待突破,特別是在微博、微信等語(yǔ)義分析方面,只有這些技術(shù)實(shí)現(xiàn)了突破,大數(shù)據(jù)的市場(chǎng)才會(huì)真正從互聯(lián)網(wǎng)領(lǐng)域走向傳統(tǒng)領(lǐng)域。
其實(shí),以Hadoop為代表的大數(shù)據(jù)相關(guān)技術(shù)也在做出一些適應(yīng)性變化。比如,Hive的出現(xiàn),就是為了方便人們像使用SQL數(shù)據(jù)庫(kù)一樣,來(lái)直接調(diào)用Hadoop中的數(shù)據(jù);而NoSQL的出現(xiàn)本質(zhì)上也是借鑒傳統(tǒng)SQL數(shù)據(jù)庫(kù)來(lái)解決非結(jié)構(gòu)化數(shù)據(jù)的管理問(wèn)題。#p#
商業(yè)智能3.0
實(shí)際上,當(dāng)我們還在探討大數(shù)據(jù)與傳統(tǒng)商業(yè)智能之間的關(guān)系時(shí)候,國(guó)外已經(jīng)有人提出了BI 3.0的概念(參見(jiàn)圖2), 將大數(shù)據(jù)也作為商業(yè)智能的一個(gè)部分。在這一概念體系中,傳統(tǒng)商業(yè)智能被稱(chēng)為BI 1.0,其與大數(shù)據(jù)結(jié)合后稱(chēng)為BI 2.0,而在結(jié)合移動(dòng)數(shù)據(jù)后就成為了BI 3.0。與之相似,在國(guó)內(nèi)也有人提出類(lèi)似的觀點(diǎn),頗為有趣的是,這種觀點(diǎn)將商業(yè)智能歸到了大數(shù)據(jù)之下,稱(chēng)大數(shù)據(jù) 3.0。

比如,天云科技***數(shù)據(jù)科學(xué)家鄭毅就將傳統(tǒng)商業(yè)智能稱(chēng)做大數(shù)據(jù)的1.0,此時(shí)處理的主要是企業(yè)內(nèi)部流轉(zhuǎn)的業(yè)務(wù)數(shù)據(jù),服務(wù)的也是企業(yè)內(nèi)部;下一階段將是大數(shù)據(jù)2.0,此時(shí)數(shù)據(jù)不只在企業(yè)內(nèi)部發(fā)揮價(jià)值,還會(huì)用這些數(shù)據(jù)向外去創(chuàng)造價(jià)值;大數(shù)據(jù)最終會(huì)走向3.0,那時(shí)數(shù)據(jù)能夠?qū)?nèi)、對(duì)外產(chǎn)生價(jià)值,同時(shí)還能在不同組織間自由流動(dòng),形成整個(gè)社會(huì)的數(shù)據(jù)基礎(chǔ)設(shè)施。
顯然,出身的不同決定了其對(duì)兩個(gè)概念的不同理解:來(lái)自傳統(tǒng)商業(yè)智能領(lǐng)域者將大數(shù)據(jù)當(dāng)成一個(gè)新增的數(shù)據(jù)源;而大數(shù)據(jù)一方則認(rèn)為傳統(tǒng)商業(yè)智能只是其領(lǐng)域中處理少量數(shù)據(jù)時(shí)的一種方法。不過(guò),對(duì)于用戶而言更希望能獲得一種整體的解決方案,即不僅要能收集、處理和分析企業(yè)內(nèi)部的業(yè)務(wù)數(shù)據(jù),還希望能引入互聯(lián)網(wǎng)上的網(wǎng)絡(luò)瀏覽、微博、微信等非結(jié)構(gòu)化數(shù)據(jù)。除此之外,還希望能結(jié)合移動(dòng)設(shè)備的位置信息,這樣企業(yè)就可以形成一個(gè)全面、完整的數(shù)據(jù)價(jià)值發(fā)展平臺(tái)。畢竟,無(wú)論是大數(shù)據(jù)還是商業(yè)智能,目的都是為分析服務(wù)的,數(shù)據(jù)全面整合起來(lái),更有利于發(fā)現(xiàn)新的商業(yè)機(jī)會(huì)。這也正是“BI 3.0”或者“Big Data 3.0”的最終目的。
實(shí)際上,用戶對(duì)數(shù)據(jù)分析相關(guān)工具和界面的融合需求也已經(jīng)開(kāi)始出現(xiàn),比如,在商業(yè)智能應(yīng)用最為普及的銀行中,就希望在原來(lái)僅僅為客戶提供支付服務(wù)之外,還能知道更多客戶的購(gòu)買(mǎi)信息(比如,物品清單),從而可以更為充分地了解客戶,為其下一步的精準(zhǔn)營(yíng)銷(xiāo)奠定基礎(chǔ)。
過(guò)往的歷史表明,技術(shù)的活力在于不斷創(chuàng)新。對(duì)于已經(jīng)存在了20多年的相對(duì)比較成熟的商業(yè)智能而言,早就形成了一個(gè)相對(duì)完善的生態(tài)系統(tǒng)。更為重要的是,大量企業(yè)在傳統(tǒng)商業(yè)智能方面已經(jīng)進(jìn)行了大量投資,特別是企業(yè)里很多業(yè)務(wù)其實(shí)已是圍繞這樣的系統(tǒng)來(lái)開(kāi)展的時(shí)候,即使真有一種可替代的技術(shù)出現(xiàn),這種替換也不會(huì)很快發(fā)生,更何況從目前來(lái)看大數(shù)據(jù)也不是這樣一種技術(shù)。基于這樣一個(gè)認(rèn)識(shí),我們認(rèn)為,在未來(lái)相當(dāng)長(zhǎng)一段時(shí)間,大數(shù)據(jù)和傳統(tǒng)商業(yè)智能將在相互促進(jìn)中競(jìng)爭(zhēng),在競(jìng)爭(zhēng)中共同進(jìn)步,最終走向“BI 3.0”或者“Big Data 3.0”。















 
 
 





 
 
 
 