別把“大數(shù)據(jù)”演繹成“大神話”
“大數(shù)據(jù)”,眼下熱得很。從某種意義上看,現(xiàn)在或未來,“得數(shù)據(jù)者得財富”,甚至“得數(shù)據(jù)者得天下”,并不夸大。因為,“大數(shù)據(jù)”不是數(shù)據(jù)大和數(shù)據(jù)多,而是從繁雜數(shù)據(jù)中摸索出規(guī)律性并加以合理應(yīng)用的計算分析能力越來越“大”。
不過,“大數(shù)據(jù)”并不神秘以前無法處理的海量數(shù)據(jù)或沒當(dāng)做數(shù)據(jù)的東西,因為計算機計算能力的進步,現(xiàn)在都可以分析出子丑寅卯了。很多人逛超市,其路徑與購物之間存在數(shù)據(jù)關(guān)系,而據(jù)此調(diào)整布局,就會促進銷售。美國有的超市把影碟與尿布放在一起出售,就是因為他們通過“大數(shù)據(jù)”分析發(fā)現(xiàn),來為孩子買尿布的大多數(shù)年輕父母,喜歡順便帶盤影碟“慰勞”自己。
如果以為有了“大數(shù)據(jù)”就沒有解決不了的問題,那更是一種誤解。人們的思想意識與行為模式,不同國家的存在與發(fā)展,都是復(fù)雜、曲折、獨特的,計算機不可能一一描繪清楚。而期望用“大數(shù)據(jù)”來解釋并指導(dǎo)世間萬物,就頗似此前用基因等生物密碼來解釋、調(diào)控人類行為模式的企圖,看起來客觀中立,實質(zhì)上以偏概全。“大數(shù)據(jù)”再“大”,也是設(shè)計者、分析者、使用者在那里說了算“大數(shù)據(jù)”并不能完全擺脫人們的曲解、隔閡和成見,再“大”的“大數(shù)據(jù)”,也會因人的因素而不夠中立、全面和公正。
“大數(shù)據(jù)”潛在的負(fù)面效應(yīng),也是不應(yīng)忽視的。例如,最近“大數(shù)據(jù)”被用來預(yù)測臉譜網(wǎng)用戶的個人信息(包括性取向、種族、宗教和政治觀點、性格特征等),而這些高度敏感信息,完全可能因雇主、房東、政府部門、教育機構(gòu)、私營組織等的選擇性使用而對個人施行歧視。
回顧這些年的“新浪潮”理念、理論和技術(shù)引入我國后,正效應(yīng)的確不少,可也有一些值得注意的教訓(xùn)。如,在對其激情頌揚和推介中,往往缺乏不同意見和善意提醒。就“大數(shù)據(jù)”而言,國際上的質(zhì)疑并不少,“大數(shù)據(jù)時代”的作者維克托就又寫了一本叫《刪除》的新書,強調(diào)大數(shù)據(jù)時代的信息取舍他稱“遺忘是一種美德”該記的記,該忘的忘??梢?,如果把“大數(shù)據(jù)”提到不恰當(dāng)高度甚至神化,對用好“大數(shù)據(jù)”必是有害無益。