Nate Silver : 大數(shù)據(jù)時代的“巫師”
科學(xué)界也有像Elon Musk那樣玩嘛嘛酷的偶像派人物?當(dāng)然有,除了美國總統(tǒng)奧巴馬想跟他“玩”以外,恐怕未來每屆的總統(tǒng)候選人也都想跟他“玩”,他就是美國當(dāng)前政治圈里的超級新星Nate Silver,號稱為美國公眾眼里完美的“預(yù)言帝”,他的“預(yù)言”被稱為競選預(yù)測之神諭。
這哥們曾單槍匹馬打敗了所有時政記者、政黨媒體顧問以及政治評論員,讓研究數(shù)字的書呆子們好好風(fēng)光了一把,美國人也因此說奧巴馬的勝利也是統(tǒng)計學(xué)家的勝利。讓我們把時間追溯回2012年美國總統(tǒng)大選時,當(dāng)時奧巴馬和羅姆尼選情普遍認(rèn)為很接近,評論員們都無法預(yù)計哪方會獲勝,Silver卻計算出“真實(shí)”情況指出二者并非處于旗鼓相當(dāng)?shù)木置妫谕镀碑?dāng)天他成功預(yù)測奧巴馬將有90.9%機(jī)會獲得大多數(shù)選票,最后他對美國50個州投票結(jié)果的預(yù)測全對了。事實(shí)上,2008年的總統(tǒng)大選他也預(yù)測對了最終結(jié)果,美國50個州的投票結(jié)果他預(yù)測對了49個。
Silver的選情分析被極度精妙的美國政治評論圈認(rèn)為是達(dá)到了前所未有的水平,但因為他所使用的是被學(xué)界稱為“巫術(shù)統(tǒng)計”的貝葉斯理論,所以也招惹來頻率學(xué)派和一些保守的統(tǒng)計科學(xué)家們質(zhì)疑,還有一些來自政黨和媒體們的指責(zé),因為Silver的預(yù)測就像是軍事級別而且是精確到個人的傾向式報導(dǎo),接下來的每一次大選,整個政治圈和媒體圈只能“坐以待斃”。
“大數(shù)據(jù)是非常重要的工具,而不是一個游戲”
在美國,做選情預(yù)測的統(tǒng)計員不計其數(shù),之所以Silver能夠一戰(zhàn)成名成為美國數(shù)據(jù)超人,皆因他在大選的節(jié)骨眼上一個人證明了大多數(shù)時政評論員是“無用”,同時他在紐約時報網(wǎng)站的博客讓眾多企業(yè)看到了大數(shù)據(jù)應(yīng)用的真實(shí)性和大數(shù)據(jù)可視化、行業(yè)化的希望。
Silve在2008年大選結(jié)束之后,很快就出版了他的處女作《信號與雜音:預(yù)測學(xué)的藝術(shù)與科學(xué)》,牛津大學(xué)數(shù)據(jù)專家維克多·邁耶曾對這本書稱贊道,大數(shù)據(jù)革命將改變我們的生活、工作和思維模式,我們不必?fù)?dān)心數(shù)據(jù)對我們自身有多大的相關(guān)性,大數(shù)據(jù)會讓我們看清楚“假說”意義,未來它將會成為影響我們決策的重要因素,因為它重塑了我們眼前的世界。
事實(shí)上,Silver也開始擔(dān)心:他的聲望將會影響往后的選情,也將失去旁觀者清優(yōu)勢。他并不希望人們視他為科學(xué)界“占卜的巫師”,不希望人們因此迷信這些預(yù)測,“預(yù)測是一門嚴(yán)謹(jǐn)科學(xué),不是一種游戲,我們要用來衡量我們主觀現(xiàn)實(shí)是否能與客觀世界吻合。”
從大數(shù)據(jù)實(shí)用性來看,大數(shù)據(jù)可以幫我們解決如災(zāi)害預(yù)告、財務(wù)預(yù)告等實(shí)際問題,但Silver也指出,數(shù)據(jù)是有陷阱的,人們經(jīng)常對數(shù)據(jù)產(chǎn)生虛有的危險幻想。“概率性思考還是絕對性思考在預(yù)測中有著截然相反的導(dǎo)向,如果不能做到誠實(shí)地看待數(shù)據(jù),預(yù)測有可能變成災(zāi)難,忽略事物的不確定性往往會導(dǎo)致嚴(yán)重后果。”
Silver舉例分析,1997年時美國國家氣象局預(yù)測,大福克斯的洪水水位是49英尺,鎮(zhèn)上的防洪堤限定為承受51英尺的洪水,并未將通過歷史數(shù)據(jù)的正負(fù)9英尺誤差算進(jìn)去,結(jié)果洪水達(dá)到了54英尺,大??怂乖庥隽颂卮蠛樗疄?zāi)難。日本福島核反應(yīng)堆是另外一個活生生的樣本,過去45年間福島最大的地震記錄是里氏規(guī)模8.0級,日本地震研究人員參考這個數(shù)據(jù)后,他們預(yù)測該地區(qū)不會超過里氏9.0級的地震規(guī)模,然后按8.5級的防震標(biāo)準(zhǔn)來建造核反應(yīng)堆,而事實(shí)上福島在過去更早的時間曾發(fā)生過9級地震,但這種情況被認(rèn)為排除了,這個預(yù)測最終為日本乃至全球帶了歷史性的災(zāi)難。
“數(shù)據(jù)本身是不能為自己代言的,我們經(jīng)常是帶著偏差的思想、個人興趣的情況開展數(shù)據(jù)分析,我們必須知道在你所接收到信息和你知道的信息之間是存在巨大鴻溝的。”Silve同時指出,是否看到自己弱點(diǎn)也對分析數(shù)據(jù)有較大的影響,因為明白自己弱點(diǎn)人反而會采取一定辦法來抵消它的作用。
相比而言,他認(rèn)為從民眾調(diào)查得回來的建模數(shù)據(jù)更可靠,因為沒有經(jīng)過媒體的渲染,直接到達(dá)他手中民意信息更真實(shí),民眾是不可能持續(xù)性地高度關(guān)注政治動態(tài)的。因而,他在做選情分析時盡量回避和兩邊的競選團(tuán)隊打交道,因為這些信息大部分是干擾的雜音,大多數(shù)政治觀察家往往容易掉進(jìn)候選人形形式式的辯論和拉票情況
“如果你想成功,可尋找和大數(shù)據(jù)相關(guān)、競爭性較小的領(lǐng)域。”
今年三十五歲Nate Silver,既沒有從哈佛耶魯大學(xué)輟學(xué)的經(jīng)歷,也沒有從實(shí)驗室建造改寫歷史記錄數(shù)學(xué)模型的成績,甚至可以說在美國大街上隨手抓一個都有可能都比他優(yōu)秀。
從芝加哥大學(xué)獲得經(jīng)濟(jì)學(xué)學(xué)位后,他去了畢馬威擔(dān)任顧問,那四年時間后來成為了他人生中最后悔的四年時間,后來他開始沉迷于網(wǎng)絡(luò)撲克,但從網(wǎng)友手中贏得的錢足夠能讓他辭掉工作靠玩撲克為生。他六歲的時候,家鄉(xiāng)的棒球隊底特律猛虎贏得了美國職業(yè)棒球全國錦標(biāo)賽的冠軍,也是在那個時候Nate Silver開始接觸并愛上了各種棒球統(tǒng)計數(shù)據(jù)。在他轉(zhuǎn)向政治數(shù)據(jù)預(yù)測之前,他是一名棒球選手成績的預(yù)測高手。
棒球燃點(diǎn)了Silver對數(shù)據(jù)的熱情,而Silver燃點(diǎn)了全球?qū)Υ髷?shù)據(jù)的追逐的激情,企業(yè)家們相信 “云端化”、或是“游戲化”必將引領(lǐng)時代的潮流,股民投資者們也希望大數(shù)據(jù)能為他們指點(diǎn)迷津,研究人員希望建立更科學(xué)更見效的模型……
“我的書可以告訴出租車司機(jī)如何工作和選擇客人,也能給網(wǎng)絡(luò)婚介網(wǎng)站一點(diǎn)經(jīng)營建議。但多數(shù)情況下,我們是無法處理龐雜無序的數(shù)據(jù),擁有更多的信息并不意味著我們能更好地預(yù)測,也就是說我們并不能夠?qū)λ袞|西進(jìn)行很精準(zhǔn)的預(yù)測。”Silver指出,事實(shí)上人們是可以非常擅長預(yù)測天氣這類事物的,但特別不擅長預(yù)測股票價格,而恐怖襲擊則是我們可以預(yù)測但卻容易忽視了的事物。
Silver的回應(yīng)估計讓不少人失望了,他建議初創(chuàng)公司不妨先嘗試進(jìn)入一些競爭性較小的領(lǐng)域。“企業(yè)可以探索一些還沒有人涉足的領(lǐng)域,如果企業(yè)在這些領(lǐng)域擁有有效的數(shù)據(jù),并可以提供相應(yīng)的分析手段,那么可能會更容易獲得成功。”
事實(shí)上,sillver也是這樣做的,他是少數(shù)最早發(fā)現(xiàn)棒球潛在的數(shù)據(jù)導(dǎo)向的人,他發(fā)現(xiàn)棒球比賽和總統(tǒng)大選都不是競爭激烈的領(lǐng)域,接著他用從網(wǎng)絡(luò)博彩中贏回來的四十萬美元創(chuàng)建了一個建模分析網(wǎng)站,專門用來預(yù)測MLB棒球運(yùn)動員職業(yè)前景的,后來他把這網(wǎng)站賣給了Baseball Prospectus。
“技巧和運(yùn)氣間存在著微妙而又模糊的關(guān)聯(lián)。贏錢的時候是因為牌技好還是運(yùn)氣好?你永遠(yuǎn)也不知道。”Silver指出,尋找那些可用的數(shù)據(jù)、但卻從沒有人拿這些數(shù)據(jù)進(jìn)行過分析的領(lǐng)域,競爭更小才更容易成功,企業(yè)所有的收益,或者說所有的競爭優(yōu)勢,都是來自于邊際收益。
看到這里,如果你非常羨慕Silver擁有這種超人能力,那不得不告訴你,不排除正是他的同性戀傾向才讓他有了這般神通廣大的“預(yù)測”能力,“我總覺得自己是個局外人,我總是有不合群的觀點(diǎn)。如果你從小就是同性戀,又或者你成長在一個相信不可知論但又篤信宗教的家庭,那你和一樣,你也不愿意相信社會的主流信念。”