大數(shù)據(jù)現(xiàn)狀與趨勢(shì):大數(shù)據(jù)應(yīng)用、治理與技術(shù)
全球范圍內(nèi),研究發(fā)展大數(shù)據(jù)技術(shù)、運(yùn)用大數(shù)據(jù)推動(dòng)經(jīng)濟(jì)發(fā)展、完善社會(huì)治理、提升政府服務(wù)和監(jiān)管能力正成為趨勢(shì)。下面將從應(yīng)用、治理和技術(shù)三個(gè)方面來(lái)講講當(dāng)前的大數(shù)據(jù)的現(xiàn)狀與趨勢(shì)。
一、大數(shù)據(jù)應(yīng)用的三個(gè)層次
按照數(shù)據(jù)開(kāi)發(fā)應(yīng)用深入程度的不同,可將眾多的大數(shù)據(jù)應(yīng)用分為三個(gè)層次。
第一層,描述性分析應(yīng)用,是指從大數(shù)據(jù)中總結(jié)、抽取相關(guān)的信息和知識(shí),幫助人們分析發(fā)生了什么,并呈現(xiàn)事物的發(fā)展歷程。
如美國(guó)的DOMO公司從其企業(yè)客戶(hù)的各個(gè)信息系統(tǒng)中抽取、整合數(shù)據(jù),再以統(tǒng)計(jì)圖表等可視化形式,將數(shù)據(jù)蘊(yùn)含的信息推送給不同崗位的業(yè)務(wù)人員和管理者,幫助其更好地了解企業(yè)現(xiàn)狀,進(jìn)而做出判斷和決策。
第二層,預(yù)測(cè)性分析應(yīng)用,是指從大數(shù)據(jù)中分析事物之間的關(guān)聯(lián)關(guān)系、發(fā)展模式等,并據(jù)此對(duì)事物發(fā)展的趨勢(shì)進(jìn)行預(yù)測(cè)。
如微軟公司紐約研究院研究員David Rothschild通過(guò)收集和分析賭博市場(chǎng)、好萊塢證券交易所、社交媒體用戶(hù)發(fā)布的帖子等大量公開(kāi)數(shù)據(jù),建立預(yù)測(cè)模型,對(duì)多屆奧斯卡獎(jiǎng)項(xiàng)的歸屬進(jìn)行預(yù)測(cè)。2014和2015年,均準(zhǔn)確預(yù)測(cè)了奧斯卡共24個(gè)獎(jiǎng)項(xiàng)中的21個(gè),準(zhǔn)確率達(dá)87.5%。
第三層,指導(dǎo)性分析應(yīng)用,是指在前兩個(gè)層次的基礎(chǔ)上,分析不同決策將導(dǎo)致的后果,并對(duì)決策進(jìn)行指導(dǎo)和優(yōu)化。
如無(wú)人駕駛汽車(chē)分析高精度地圖數(shù)據(jù)和海量的激光雷達(dá)、攝像頭等傳感器的實(shí)時(shí)感知數(shù)據(jù),對(duì)車(chē)輛不同駕駛行為的后果進(jìn)行預(yù)判,并據(jù)此指導(dǎo)車(chē)輛的自動(dòng)駕駛。
當(dāng)前,在大數(shù)據(jù)應(yīng)用的實(shí)踐中,描述性、預(yù)測(cè)性分析應(yīng)用多,決策指導(dǎo)性等更深層次分析應(yīng)用偏少。不同類(lèi)型的應(yīng)用意味著人類(lèi)和計(jì)算機(jī)在決策流程中不同的分工和協(xié)作。
雖然已有很多成功的大數(shù)據(jù)應(yīng)用案例,但還遠(yuǎn)未達(dá)到我們的預(yù)期,大數(shù)據(jù)應(yīng)用仍處于初級(jí)階段。未來(lái),隨著應(yīng)用領(lǐng)域的拓展、技術(shù)的提升、數(shù)據(jù)共享開(kāi)放機(jī)制的完善,以及產(chǎn)業(yè)生態(tài)的成熟,具有更大潛在價(jià)值的預(yù)測(cè)性和指導(dǎo)性應(yīng)用將是發(fā)展的重點(diǎn)。
大數(shù)據(jù)治理體系的發(fā)展
隨著大數(shù)據(jù)作為戰(zhàn)略資源的地位日益凸顯,人們?cè)絹?lái)越強(qiáng)烈地意識(shí)到制約大數(shù)據(jù)發(fā)展最大的短板之一就是:數(shù)據(jù)治理體系遠(yuǎn)未形成,如數(shù)據(jù)資產(chǎn)地位的確立尚未達(dá)成共識(shí),數(shù)據(jù)的確權(quán)、流通和管控面臨多重挑戰(zhàn);數(shù)據(jù)壁壘廣泛存在,阻礙了數(shù)據(jù)的共享和開(kāi)放;法律法規(guī)發(fā)展滯后,導(dǎo)致大數(shù)據(jù)應(yīng)用存在安全與隱私風(fēng)險(xiǎn)等等。如此種種因素,制約了數(shù)據(jù)資源中所蘊(yùn)含價(jià)值的挖掘與轉(zhuǎn)化。
其中,隱私、安全與共享利用之間的矛盾問(wèn)題尤為凸顯。一方面,數(shù)據(jù)共享開(kāi)放的需求十分迫切。近年來(lái)人工智能應(yīng)用取得的重要進(jìn)展,主要源于對(duì)海量、高質(zhì)量數(shù)據(jù)資源的分析和挖掘。而對(duì)于單一組織機(jī)構(gòu)而言,往往靠自身的積累難以聚集足夠的高質(zhì)量數(shù)據(jù)。
另外,大數(shù)據(jù)應(yīng)用的威力,在很多情況下源于對(duì)多源數(shù)據(jù)的綜合融合和深度分析,從而獲得從不同角度觀察、認(rèn)知事物的全方位視圖。而單個(gè)系統(tǒng)、組織的數(shù)據(jù)往往僅包含事物某個(gè)片面、局部的信息,因此,只有通過(guò)共享開(kāi)放和數(shù)據(jù)跨域流通才能建立信息完整的數(shù)據(jù)集。
然而,另一方面,數(shù)據(jù)的無(wú)序流通與共享,又可能導(dǎo)致隱私保護(hù)和數(shù)據(jù)安全方面的重大風(fēng)險(xiǎn),必須對(duì)其加以規(guī)范和限制。2016年11月7日,全國(guó)人大常委會(huì)通過(guò)的《中華人民共和國(guó)網(wǎng)絡(luò)安全法》中明確了對(duì)個(gè)人信息收集、使用及保護(hù)的要求,并規(guī)定了個(gè)人對(duì)其個(gè)人信息進(jìn)行更正或刪除的權(quán)利。2019年,中央網(wǎng)信辦發(fā)布了《數(shù)據(jù)安全管理辦法(征求意見(jiàn)稿)》,向社會(huì)公開(kāi)征求意見(jiàn),明確了個(gè)人信息和重要數(shù)據(jù)的收集、處理、使用和安全監(jiān)督管理的相關(guān)標(biāo)準(zhǔn)和規(guī)范。相信這些法律法規(guī)將在促進(jìn)數(shù)據(jù)的合規(guī)使用、保障個(gè)人隱私和數(shù)據(jù)安全等方面發(fā)揮不可或缺的重要作用。
大數(shù)據(jù)理論與技術(shù)創(chuàng)新
近年來(lái),數(shù)據(jù)規(guī)模呈幾何級(jí)數(shù)高速成長(zhǎng)。據(jù)國(guó)際信息技術(shù)咨詢(xún)企業(yè)國(guó)際數(shù)據(jù)公司(IDC)的報(bào)告,2020年全球數(shù)據(jù)存儲(chǔ)量將達(dá)到44ZB(1021),到2030年將達(dá)到2500ZB。當(dāng)前,需要處理的數(shù)據(jù)量已經(jīng)大大超過(guò)處理能力的上限,從而導(dǎo)致大量數(shù)據(jù)因無(wú)法或來(lái)不及處理,而處于未被利用、價(jià)值不明的狀態(tài),這些數(shù)據(jù)被稱(chēng)為“暗數(shù)據(jù)”。
據(jù)國(guó)際商業(yè)機(jī)器公司(IBM)的研究報(bào)告估計(jì),大多數(shù)企業(yè)僅對(duì)其所有數(shù)據(jù)的1%進(jìn)行了分析應(yīng)用。近年來(lái),大數(shù)據(jù)獲取、存儲(chǔ)、管理、處理、分析等相關(guān)的技術(shù)已有顯著進(jìn)展,但是大數(shù)據(jù)技術(shù)體系尚不完善,大數(shù)據(jù)基礎(chǔ)理論的研究仍處于萌芽期。
推演信息技術(shù)的未來(lái)發(fā)展趨勢(shì),較長(zhǎng)時(shí)期內(nèi)仍將保持漸進(jìn)式發(fā)展態(tài)勢(shì),隨技術(shù)發(fā)展帶來(lái)的數(shù)據(jù)處理能力的提升將遠(yuǎn)遠(yuǎn)落后于按指數(shù)增長(zhǎng)模式快速遞增的數(shù)據(jù)體量,數(shù)據(jù)處理能力與數(shù)據(jù)資源規(guī)模之間的“剪刀差”將隨時(shí)間持續(xù)擴(kuò)大,大數(shù)據(jù)現(xiàn)象將長(zhǎng)期存在。在此背景下,大數(shù)據(jù)現(xiàn)象倒逼技術(shù)變革,將使得信息技術(shù)體系進(jìn)行一次重構(gòu),這也帶來(lái)了顛覆式發(fā)展的機(jī)遇。
例如,計(jì)算機(jī)體系結(jié)構(gòu)以數(shù)據(jù)為中心的宏觀走向和存算一體的微觀走向,軟件定義方法論的廣泛采用,云邊端融合的新型計(jì)算模式等;網(wǎng)絡(luò)通信向?qū)拵?、移?dòng)、泛在發(fā)展,海量數(shù)據(jù)的快速傳輸和匯聚帶來(lái)的網(wǎng)絡(luò)的Pb/s級(jí)帶寬需求,千億級(jí)設(shè)備聯(lián)網(wǎng)帶來(lái)的Gb/s級(jí)高密度泛在移動(dòng)接入需求;大數(shù)據(jù)的時(shí)空復(fù)雜度亟需在表示、組織、處理和分析等方面的基礎(chǔ)性原理性突破,高性能、高時(shí)效、高吞吐等極端化需求呼喚基礎(chǔ)器件的創(chuàng)新和變革;軟硬件開(kāi)源開(kāi)放趨勢(shì)導(dǎo)致產(chǎn)業(yè)發(fā)展生態(tài)的重構(gòu)等等。
當(dāng)然,不管是大數(shù)據(jù)的應(yīng)用、數(shù)據(jù)治理體系的建設(shè),大數(shù)據(jù)理論與技術(shù)的創(chuàng)新,也離不開(kāi)專(zhuān)業(yè)人才的支持,尤其是在大數(shù)據(jù)快速發(fā)展的當(dāng)下,各方面的人才需求都在增加,越早入行也意味著更多的發(fā)展機(jī)遇。

























