足球數(shù)據(jù) | 被對手進(jìn)球后的十分鐘內(nèi)最有可能扳回比分
作者|Alex Bleakley
選文 | Aileen
翻譯 | 徐宇文
校對 | 王昱森
摘要:在凌晨結(jié)束的世預(yù)賽亞洲區(qū)12強(qiáng)賽第4場比賽中,中國隊(duì)客場0比2不敵烏茲別克斯坦,4戰(zhàn)之后僅積1分。賽后,國足主帥高洪波在發(fā)布會(huì)上宣布辭職。
有人說,當(dāng)一支足球隊(duì)剛進(jìn)球了以后,他們會(huì)突然變得比之前更容易被對方進(jìn)球,這種說法是可靠的嗎?這一現(xiàn)象又與主客場、球隊(duì)實(shí)力等因素有無關(guān)系?
來自英國的作者Alex Bleakley通過數(shù)據(jù)分析,針對這一現(xiàn)象進(jìn)行了研究:他分析了2015-2016賽季的英超聯(lián)賽數(shù)據(jù),比較在前一個(gè)進(jìn)球之后10分鐘以內(nèi)的進(jìn)球數(shù)量與同一個(gè)聯(lián)賽所有比賽中的相同10分鐘時(shí)段的進(jìn)球數(shù)量,并得出了有趣的結(jié)論:盡管雙方球隊(duì)在發(fā)生進(jìn)球后的5分鐘內(nèi)都比較難再次進(jìn)球,但是在這之后的5分鐘內(nèi),失球球隊(duì)進(jìn)球的可能性很高。
有人說,當(dāng)一支足球隊(duì)剛進(jìn)球了以后,他們會(huì)突然變得比之前更容易被對方進(jìn)球,這種說法是可靠的嗎?
上周,我們就進(jìn)球是不是更傾向于成對出現(xiàn)進(jìn)行了研究,具體做法是比較在前一個(gè)進(jìn)球之后10分鐘以內(nèi)的進(jìn)球數(shù)量與同一個(gè)聯(lián)賽所有比賽中的相同10分鐘時(shí)段的進(jìn)球數(shù)量。
我們還將每支隊(duì)伍的實(shí)力差別,和主客場因素考慮了進(jìn)來,以站在脫離特定球隊(duì)的基礎(chǔ)上更精確地計(jì)算進(jìn)球數(shù)的期望值。此項(xiàng)研究將會(huì)提出這樣一種可能性,如果先回答一個(gè)問題:進(jìn)球方或失球方是否會(huì)更容易被對方進(jìn)球,我們就可以據(jù)此預(yù)測出某些場次的比賽更可能出現(xiàn)更多的進(jìn)球數(shù)。
我們的數(shù)據(jù)中有三個(gè)主要的因子是可用于預(yù)測一支足球隊(duì)在一場特定的比賽中的進(jìn)球數(shù)的:
- 主場比賽還是客場比賽;
- 這支球隊(duì)的平均進(jìn)球數(shù);
- 對手的平均失球數(shù)。
我們通過觀察一個(gè)聯(lián)賽所有場次的比賽來收集上述三個(gè)因子的數(shù)據(jù)。為了量化主客場優(yōu)勢,我們通過計(jì)算主場/客場球隊(duì)平均每場球的進(jìn)球數(shù)占整個(gè)賽季中所有球隊(duì)在所有比賽中的平均進(jìn)球數(shù)的比例,量化了一個(gè)主場/客場實(shí)力因子。
例如,在2015-2016賽季的英超聯(lián)賽中,這些因子是:
類似地,我們通過觀察球隊(duì)進(jìn)球/失球數(shù)占整個(gè)聯(lián)賽的平均值的比例來計(jì)算一支球隊(duì)的進(jìn)攻實(shí)力因子和防御實(shí)力因子。例如, 曼城俱樂部在2015-2016賽季的因子是:
***,因?yàn)榍蜿?duì)們不是自己跟自己比賽的,數(shù)學(xué)模型要求我們對這些因子的值做一些微調(diào)以避免對進(jìn)球數(shù)目的一致估計(jì)過高。解決方法是對預(yù)測的進(jìn)球數(shù)除以一個(gè)校正因子,這個(gè)因子是為每一個(gè)所考察的聯(lián)賽單獨(dú)計(jì)算的,處在1.002到1.004之間。
通過對進(jìn)球數(shù)的分布和三個(gè)主要因子的獨(dú)立性做一些常規(guī)的假設(shè),我們能用下面的這個(gè)公式來計(jì)算主場球隊(duì)在給定的5分鐘時(shí)間內(nèi)進(jìn)球數(shù)的期望值。
類似地,我們把主場實(shí)力因子換成客場實(shí)力因子就可以計(jì)算出客場球隊(duì)的進(jìn)球數(shù)期望值。
接下來,我們可以通過對圖表中的所有進(jìn)球數(shù)取平均,來繪制一些類似的表格,但是這次是在考量了球隊(duì)實(shí)力的基礎(chǔ)上:
圖表1:歐洲各大聯(lián)賽2015-2016賽季進(jìn)球后10分鐘內(nèi)再次進(jìn)球數(shù)的真實(shí)值與期望值的對比,考慮了主場與客場實(shí)力差異
然而,一旦我們把比賽球隊(duì)的實(shí)力考慮進(jìn)來,進(jìn)球后5-10分鐘區(qū)間內(nèi)的再次進(jìn)球數(shù)只增加了5%,所以僅僅基于這張圖表,我們在提出“進(jìn)球數(shù)的增加與***個(gè)進(jìn)球直接相關(guān)”這一論斷的時(shí)候需要更慎重。
然而,如果把上圖拆分為剛剛進(jìn)球的球隊(duì)和剛剛失球的球隊(duì),我們將會(huì)得到一些更有趣的結(jié)論。
圖表2:歐洲各大聯(lián)賽2015-2016賽季進(jìn)球后10分鐘內(nèi)再次進(jìn)球數(shù)的真實(shí)值與期望值的對比,考慮了主場與客場實(shí)力差異,并且根據(jù)進(jìn)球球隊(duì)和失球球隊(duì)進(jìn)行了拆分
這些表格說明,盡管雙方球隊(duì)在發(fā)生進(jìn)球后的5分鐘內(nèi)都比較難再次進(jìn)球,但是在這之后的5分鐘內(nèi),失球球隊(duì)進(jìn)球的可能性有了相對提升,進(jìn)球球隊(duì)則沒有。下圖通過每一分鐘的記錄可視化了這一事實(shí):
圖表3:歐洲六大聯(lián)賽2015-2016賽季發(fā)生進(jìn)球后每一分鐘進(jìn)球數(shù)目期望值和實(shí)際值差異百分比,按照進(jìn)球球隊(duì)和失球球隊(duì)分組
當(dāng)然,這一事實(shí)并不一定意味著,如果曼城跟桑德蘭比賽并且進(jìn)球了,桑德蘭現(xiàn)在就比曼城更有可能進(jìn)下一個(gè)球。但是意味著桑德蘭比之前更有可能進(jìn)球,但曼城不會(huì)。
所以,如果球隊(duì)管理層警告你說在進(jìn)球后的10分鐘內(nèi)一定要讓后防線保持充分的警惕,這個(gè)建議可能真的是有用的,因?yàn)閿?shù)據(jù)也這樣說。
來源:http://www.content-loop.com/are-football-teams-most-vulnerable-after-theyve-just-scored/
【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號“大數(shù)據(jù)文摘( id: BigDataDigest)”】