2013數(shù)據(jù)庫技術(shù)大會:大數(shù)據(jù)正當(dāng)時
NoSQL的春天
時光回溯2010年數(shù)據(jù)庫技術(shù)大會,在這屆大會上51CTO編輯彭凡對Oracle知名專家蓋國強老師進(jìn)行專訪時談到了NoSQL。當(dāng)時大家還覺得NoSQL正在興起,還屬于Web和數(shù)據(jù)庫的前端技術(shù)。3年時間過去了,當(dāng)年還在襁褓中的NoSQL數(shù)據(jù)庫已經(jīng)遍地開花,在本次數(shù)據(jù)庫技術(shù)大會上關(guān)于NoSQL方面的分享占據(jù)了較大的篇幅。
會場座無虛席
當(dāng)NoSQL在非結(jié)構(gòu)化數(shù)據(jù)方面的特殊能力被捆綁在大數(shù)據(jù)戰(zhàn)車上之后。大家一談到大數(shù)據(jù)必然會將NoSQL帶入到討論中。HBase、Cassandra等等都成為大數(shù)據(jù)的得力工具。經(jīng)過這幾年的飛速發(fā)展,NoSQL已經(jīng)逐漸落地成為數(shù)據(jù)庫市場的強勁力量。即使Oracle等傳統(tǒng)數(shù)據(jù)庫廠商,也會在MySQL 5.6等新版本數(shù)據(jù)庫中增強對NoSQL的支持。
大數(shù)據(jù)模型與處理能力
從一開始,大數(shù)據(jù)就需要優(yōu)秀的模型來實現(xiàn)復(fù)雜的分析和預(yù)測模型,產(chǎn)生針對目標(biāo)業(yè)務(wù)的輸出。傳統(tǒng)的數(shù)據(jù)庫對于數(shù)據(jù)挖掘和分析做的還是不夠好,對于大數(shù)據(jù)的處理能力低下。
人人網(wǎng)陳繼東
來自人人網(wǎng)的陳繼東講師表示,未來大數(shù)據(jù)作更深入的分析,數(shù)據(jù)清洗ETL的開銷會很大。需要并行數(shù)據(jù)挖掘和機器學(xué)習(xí)的能力,大數(shù)據(jù)不再是模型的競爭,而是計算能力的競爭。能不能在更短時間內(nèi)清洗和處理完呈幾何爆炸式增長的數(shù)據(jù),是各位DBA或者CTO首先考慮的問題。
傳統(tǒng)數(shù)據(jù)庫的發(fā)展和升級之路
當(dāng)Oracle 11g已經(jīng)推出若干年之后,還有不少用戶的數(shù)據(jù)運行在Oracle 10g之上。來自上海新炬網(wǎng)絡(luò)技術(shù)有限公司的技術(shù)總監(jiān)楊志洪就為大家分享了如何從Oracle 10g R2遷移到11g的案例。在Oracle 12c都呼之欲出的今天,用戶處于數(shù)據(jù)安全和穩(wěn)定性的考慮,并不急于升級。只有出現(xiàn)如下情況時,升級才顯得那么的逼不得已。
1.Oracle已經(jīng)通知用戶,對于Oracle 10g將在2013年7月停止新補丁的發(fā)行,并從此不再保證7X24的第一級支持。
2.運維系統(tǒng)遇到多處全球首次發(fā)現(xiàn)的Bug,DBA處理難度提升。
3.核心數(shù)據(jù)庫已經(jīng)安裝幾十兆甚至上百兆的Patch,系統(tǒng)繼續(xù)維持的成本上升。
下面是楊志洪老師分享的第一個案例場景,用戶已經(jīng)將操作系統(tǒng)和硬件都進(jìn)行了變更。
第二種場景是保留操作系統(tǒng),升級和更改硬件的模式。
在升級到11g之后,我們還需要在從SQL優(yōu)化集創(chuàng)建SQL計劃基準(zhǔn),在生產(chǎn)庫中記錄完整的生產(chǎn)庫的負(fù)載,包括實際負(fù)載,時間和并發(fā)情況。在測試環(huán)境中完全按照生產(chǎn)庫的負(fù)載情況進(jìn)行充放,嚴(yán)格的事務(wù)提交順序等等。
總結(jié)
大數(shù)據(jù)在目前是一個炙手可熱的名詞,它已經(jīng)在社交媒體,網(wǎng)絡(luò)游戲,電子商務(wù)等領(lǐng)域落地。電子商務(wù)網(wǎng)站用大數(shù)據(jù)分析用戶的購買行為,為他們推薦合適的促銷產(chǎn)品。網(wǎng)絡(luò)游戲廠商通過大數(shù)據(jù)處理用戶留存率,道具購買率等數(shù)據(jù),從而確保公司的整體盈利效果。社交媒體則走的更遠(yuǎn),已經(jīng)有美國政治分析家透過Facebook和推特分析美國選民的投票傾向和廣告投放策略。大數(shù)據(jù)讓本來看似雜亂無章的世界,變得有跡可循。
























