基礎(chǔ)架構(gòu)受阻 大數(shù)據(jù)何談大價值
在關(guān)于大數(shù)據(jù)的交流對話中,缺少對支持其運行的必要基礎(chǔ)設(shè)施的關(guān)注—特別是實時應(yīng)用方面。
對于很多企業(yè)來說,大數(shù)據(jù)意味著有權(quán)使用它們一直用的數(shù)據(jù)倉庫。數(shù)據(jù)倉庫已經(jīng)并將繼續(xù)作為企業(yè)級組織的關(guān)鍵組成部分。
這樣的系統(tǒng)通過組織提供數(shù)據(jù)集合并且可以將數(shù)據(jù)分解并打包,使業(yè)務(wù)分析師能夠?qū)I(yè)務(wù)狀況進行深入分析。
正是這種數(shù)據(jù)形式(經(jīng)分析處理轉(zhuǎn)化為可操作的信息),將被集成到數(shù)據(jù)中心,用于應(yīng)用程序和基礎(chǔ)設(shè)施,作為輸入信息進入無數(shù)的系統(tǒng)和程序來進行近實時決策。
但是,數(shù)據(jù)倉庫的設(shè)計并不是為了這些形式的大量的集成和訪問量,也不是為了各種各樣的協(xié)助處理數(shù)據(jù)的商業(yè)智能系統(tǒng)。
有時候大量的輸入數(shù)據(jù)會使支持系統(tǒng)崩潰,加上那些大量的試圖訪問精確數(shù)據(jù)的系統(tǒng),這樣的應(yīng)用程序不大可能支撐住如此大的壓力。
如果企業(yè)中的大數(shù)據(jù)成為用來發(fā)展業(yè)務(wù)和操作的成功平臺,那么必須將它視為一個更重要的數(shù)據(jù)中心資產(chǎn)。這一途徑需要長時間艱苦的努力進行基礎(chǔ)設(shè)施和體系結(jié)構(gòu)的建設(shè),以保證對該系統(tǒng)的訪問并且可以擴展以滿足更多需要。
與用在面向公眾的應(yīng)用程序一樣的體系結(jié)構(gòu),我們幾乎肯定會用于實現(xiàn)模型中,該模型中大數(shù)據(jù)可以像傳統(tǒng)使用一樣(每天甚至每周)以及接近實時。這是我們期待的下一代數(shù)據(jù)中心模型的發(fā)展方向,也是最有價值的地方。
數(shù)據(jù)檢索堵塞
可靠性是最重要的,尤其是涉及基礎(chǔ)設(shè)施的地方?;A(chǔ)設(shè)施和應(yīng)用服務(wù)的整合經(jīng)常會出現(xiàn)障礙,這會導(dǎo)致系統(tǒng)在實時檢索數(shù)據(jù)時需要進行等待。它就是不能連續(xù)處理,直到該進程完成或者以其他方式成功。
當(dāng)服務(wù)運行良好的時候,堵塞不再是什么問題。數(shù)據(jù)幾乎可以立即重新獲取,并繼續(xù)進行處理。但是當(dāng)服務(wù)不堪重負時,對此依賴的系統(tǒng)將陷入等待響應(yīng)。
這種延遲會影響數(shù)據(jù)供應(yīng)鏈,從服務(wù)本身到相依系統(tǒng)以及最終的用戶,這些用戶不明白為什么系統(tǒng)會反應(yīng)遲鈍,因為它深深隱藏在幾個體系架構(gòu)層下,還沒有辦法通過系統(tǒng)及時通知他們。
因此,大數(shù)據(jù)系統(tǒng)的可靠性和性能是必須保證的。一個適當(dāng)?shù)脑O(shè)計架構(gòu),要聚焦可擴展性和內(nèi)部關(guān)聯(lián)性,這是大數(shù)據(jù)驅(qū)動組織的特點。
今天所關(guān)注的投入體系結(jié)構(gòu)的建設(shè)以實現(xiàn)可擴展性的路肯定需要很長的時間,才能使整個數(shù)據(jù)中心能夠廣泛的使用大數(shù)據(jù)。