06.19 誰將捧起世界盃?別猜了,我們數學老師已經算出了結果!

你是喜歡嚴密的數據分析,還是球星的靈光閃現?當數學遇上足球,我的數學老師準備教體育了,會產生什麼樣的化學反應?

誰將捧起世界盃?別猜了,我們數學老師已經算出了結果!

“要踢得漂亮還是要贏球?這是一個世紀以來所有足球人共同的難題。奧地利因斯布魯克大學(University of Innsbruck)的Zeileis A, Leitner C, Hornik K 等人近期進行的研究表明,本屆俄羅斯世界盃的冠軍將從德國和巴西兩支隊伍中產生。(但是吧,從最近的比賽看來,這位老師可能.....emmm)

但我們關注的是:數學家究竟是基於什麼樣的數據和方法,得出了這一預測結果?

誰將捧起世界盃?別猜了,我們數學老師已經算出了結果!

圖1. 各個國家隊奪冠的概率,巴西、德國和西班牙位列前三。

答案是,他們應用了數值分析模擬的方式進行預測。對於這種方式,重要(也是首要)的是,根據“輸入-輸出”建立一個反應本質的數學模型。對於球隊間輸贏的預測,最直觀、有效的輸入數據有兩個來源,一個是FIFA(國際足聯)等組織給出的排名評分,另一個便是各家博彩公司給出的賠率。Zeileis等人使用的正是賠率數據。他們的思路是這樣的:

  1. 假設每個球隊都有一個能力值,這個值可以抽象地完全代表這支球隊;
  2. 如果我們知道了能力值,那麼我們就可以計算出兩隊勝負概率,從而進一步計算出賠率;
  3. 那麼我們也可以反過來,在已知球隊賠率的情況下,算出各個球隊的能力值;
  4. 接下來可以通過這個能力值按概率進行大量模擬,考慮世界盃可能出現的各種情況,最後得出結果。

用能力值來預測模擬獲勝概率的公式,最初由美國弗吉尼亞理工學院的Bradley和Terry[2]在1952年提出:

誰將捧起世界盃?別猜了,我們數學老師已經算出了結果!

如果我們知道了這個勝負的概率,就可以進一步模擬比賽的過程,算出每場比賽進程的可能性,也就可以預測大力神杯最有可能會被哪支球隊捧起了。但正如上面思路中所介紹的,該課題組反其道而行之,他們想通過博彩公司給出的賠率,推算出各隊獲得冠軍的概率,然後再反過來計算出各個球隊的“能力值“。為此,他們用計算機模擬了一百萬次,讓各隊的能力值都能給出與賠率相符的結果。

根據計算結果,能力值前7位排名如下:

誰將捧起世界盃?別猜了,我們數學老師已經算出了結果!

確定了各隊的能力值,可以做的便更多了,比如說計算小組出線的概率。這個研究組經過計算得出:C組的法國、E組的巴西和F組的德國為該組大熱門,有超過90%的機會出線;G組英格蘭和比利時恐怕要為小組頭名爭個頭破血流;競爭最激烈的莫過於有著哥倫比亞與波蘭的H組,該小組最熱門的哥倫比亞出線概率只有約65%,但最低的日本也有接近40%的出線希望,而且有趣的是,計算結果更看好的是哥倫比亞,而不是該組的種子隊波蘭。事實上,通過這種方式,我們可以計算出所有球隊的“生存曲線“,來預測各支球隊在淘汰賽中能走多遠。

誰將捧起世界盃?別猜了,我們數學老師已經算出了結果!

圖2. 2018世界盃各球隊的生存曲線。

袋鼠軍團奪冠概率:0.1%

來自澳大利亞阿德萊德大學的Steve Begg教授也對本屆世界盃進行了預測[3]。他取材的數據來自FIFA過去四年給出的排名,以及過去三屆世界盃的比賽結果,用到的核心方法是“蒙特卡洛方法“。這種在二戰期間發展起來的數值模擬方法,使得我們可以不用計算出每一種情況,而是通過類似於隨機取點的方式,更快速準確地計算出結果。

Steve Begg教授在使用FIFA排名數據的時候,還對其作了一定修正。例如,東道主俄羅斯會有一定的主場優勢,弱隊對抗強隊時會更加專注。同時,在這個數學模型中,他還引入了兩個不確定量:這屆世界盃球隊的整體狀態和每場比賽的意外因素影響。這些影響參考了最近三屆世界盃的比賽數據。

Steve Begg教授用他自己提出的模型進行了十萬次的模擬計算,雖然數量上遠小於所有的可能結果(要知道僅小組賽就有近4.3億種不同情況),但這種方法也可以對結果有一個足夠精確的預測。不過遺憾的是,根據他的計算,袋鼠軍團獲得世界盃冠軍的概率只有0.1%。

這種由排名進行的預測,與奧地利研究組用賠率進行的預測相比,結果上有什麼差別?奧地利研究組已經進行了對比,結果如下:

誰將捧起世界盃?別猜了,我們數學老師已經算出了結果!

圖3. 賠率計算的能力值與Elo等級分的對比

我們可以看出,由賠率計算出的能力值的對數與Elo等級分很接近,相關係數達到了0.89。Elo等級分制度由匈牙利裔美國物理學家Arpad Elo創建,用於衡量各類對弈活動水平,是當今對弈水平評估公認的權威方法。這個結果與FIFA給出的排名也很接近,相關係數為0.76。兩者出入的很大一部分,緣於排名並沒有考慮諸如主場優勢(俄羅斯賠率高出應有的排名很多)、球星受傷(不久前在歐冠決賽中受傷的埃及新星薩拉內很有可能在世界盃期間復出)等場外因素。我們得到的最新消息是,本屆世界盃開賽前1天,西班牙隊臨陣換帥,這無疑將對之前的預測結果產生影響。

另一方面,球迷的心中期望和球隊實際能力並不完全相符。例如擁有眾多球星的法國、比利時及阿根廷,大牌球星的吸粉能力讓球迷們對他們的球隊抱有更多期望,而博彩公司必須對這些情況進行考慮。

霍金曾為英格蘭隊制定奪冠方案

相比數學家的統計模擬,物理學家的思維方式全然不同。前不久去世的著名理論物理學家霍金在2014年巴西世界盃之前,曾經對於英格蘭如何能奪冠進行了研究,併為祖國的球隊提出了一套事無鉅細的奪冠方案[4]:

  • 最佳氣溫為27℃,如果提高5℃會降低59%的勝率
  • 要穿紅色的球衣而不是白色,紅色可以讓球員更舒適且更具有侵略性
  • 4-3-3的陣型更適合英格蘭,而不是更常用的4-4-2
  • 在下午當地時間下午3點開球
  • 等等

真希望英格蘭足協能好好看看這些建議,要不然也不會只踢了三場比賽就直接回家。

這些計算與預測究竟有多麼精準?“概率具有主觀性,它取決於你對事物的瞭解程度,”Begg教授說道,“我們根據已有的信息進行判斷和預測,因此信息的準確性及推理的嚴密性是十分重要的。”

如果足夠細心的話,我們也會發現,雖然這些預測考慮了很多條件的影響,但對於影響比賽的複雜性和隨機性因素的認識顯然遠遠不夠。例如,球隊打法的相剋性,世界盃期間球員的狀態保持,主教練戰術的佈置以及轉變等等,這些因素都沒能很好地放入數學模型當中。顯然,直到今天,我們依然對這個職業化已經有一百五十多年的運動不夠了解。但這種不確定性也正是足球運動的魅力所在。

“最終的結果只有在7月15日的決賽結束後才能清楚……要知道,博彩公司一般都會保持15.2%的盈利,” Zeileis在論文中總結道,“我們不會去下注,這樣我們就會有一個確定的結果,那就是:將有100%的幾率享受一場令人激動的足球盛宴!“

#中國數學教育#溫馨提示:賠率有風險,看球須盡興。


分享到:


相關文章: