德國人預測世界盃: 冠軍是西班牙!

NO IMAGE

2018年俄羅斯世界盃揭幕戰已在莫斯科打響!A組東道主俄羅斯5比0大勝沙特,取得了開門紅。

在現場的沙特球迷

其實在賽前,從電視臺到營銷機構,從博彩公司到普通球迷,就紛紛對比賽結果進行了預測。不止是首戰,他們連總決賽冠軍是誰都心裡有“譜”了。

但預測這種事兒吧,一半靠分析,另一半基本靠運氣。這也是為什麼博彩業成百上千名分析師拿著各種資料絞盡腦汁最後得來的賠率和預測結果,還不如章魚保羅準……

當一個行業沒什麼進步的時候,總會有人來顛覆它。近年來人工智慧技術發展迅猛,在統治了影象識別、語音分析、自動駕駛等熱門領域之後,也開始挑戰世界盃比賽結果預測這門行當了。

2018年,全球多家權威機構在預測時,就採用了機器學習的途徑來進行預測。

有趣的是:不同機構的預測結果竟然完全不同……

2018 世界盃

德國人預測:西班牙是冠軍

嚴謹誠實的德國人,今年做出了一個非常誠實的判斷……

具體來說,按照今年抽籤的分組結果,從小組賽的階段開始預測,在所有的三十二支球隊中,西班牙最終奪得冠軍的勝算最大,約為 17.8%,高於德國的 17.1% 和巴西的 12.3%。

做出這個預測的是德國多特蒙德工業大學統計學系的助理教授,Anreas Groll 所帶領的團隊。

他們是怎麼算出這個結果的呢?

其實他們採用的是一種近幾年來在機器學習領域開始受歡迎的統計方法:隨機決策森林 (random decision forests),簡稱隨機森林

Groll 教授介紹,隨機森林是一種融合了統計學和機器學習的方法。它常被人拿來和決策樹,另一種更為人所熟知的統計方法比較。

(以下進入不那麼枯燥的教學時間:)

決策樹和隨機森林的區別很好理解。就拿世界盃正賽來說,一支球隊最終奪冠的機率並不是瞎猜出來的。

大家都知道,球隊奪冠的路徑是從每組四支球隊的小組賽前兩名出線,然後經歷八分之一決賽、四分之一決賽、半決賽、總決賽才能奪冠。

如果你找一個常見的決策樹系統來判斷,它在 32 進 16、16 進 8、8 進 4、4 進 2 和決賽的每個階段都進行大量的計算,最後可能得到一個十分怪異的結果,比如中國隊奪冠之類的……

因為它在當前階段做出的決策,都高度依賴上一階段的決策。這就好比一棵樹,如果從根部就長歪了,再怎麼往上長,也只能是在歪的上面不斷進行修正,還有可能更歪,最後長成一棵扭曲的,現實中根本不可能存在的樹……

至於隨機森林,名字已經很直白了:簡單來說,隨機森林就是一座由很多決策樹所聚集而成的森林,然後用所有決策樹的結果進行投票,得出一個多數的、近似於平均的結果。

要構建這個森林,首先 Groll 教授團隊需要訓練決策樹,修剪好“枝杈”,不讓沒用的枝杈影響樹的生長。

這些枝杈就是引數,大量的經濟、體育、地緣引數,比如國家人均 GDP、國際足聯排名、國家來自哪個大洲、博彩公司給出的賠率,甚至精細到球員人數、平均年齡、頂級聯賽球員比例和教練的工齡等等……

在不斷訓練的過程中,沒用的引數就被排除出去了,就像被剪掉的枝杈。這個過程培育出了一座有很多樹,每棵樹都不是太枝繁葉茂的森林。團隊認為,這樣得到的結果應該是比較準確的。

最後,這個森林根據模擬出每場比賽的進球數來判定球隊輸贏。

採用隨機森林的方法,還有另外一個效果,那就是在不同階段,根據不同的結果重新預測和修改結果。

前面提到,“西班牙是冠軍”的預測是在小組賽還未開始階段得到的。團隊進行了十萬次模擬,發現如果德國隊和西班牙隊都能突圍四分之一決賽,之後的預測顯示雙方勝率基本相等了。

西班牙隊出征世界盃名單

https://arxiv.org/pdf/1806.03208.pdf 

你可以在上面這個連結看到 Groll 教授團隊的論文。如果仔細讀了,你會發現預測結果有很多矛盾衝突的地方,比如前面說德國衛冕概率僅次於西班牙奪冠,後面又說德國突圍四分之一決賽的概率是十萬分之一;再比如西班牙和德國的勝率都 >17%,而總決賽陣容概率最高的卻是巴西對德國,而且居然是德國高。

論文也沒有解釋這些矛盾都是怎麼來的,不過球迷大可不必懊惱,因為預測本身就是概率的遊戲,真實情況在一定程度上體現概率的作用,同時總會有概率無法涉及到的情況出現(比如西班牙突然換帥開掉了洛佩特吉,而這又會怎樣影響勝率呢?)

對於 Groll 老師的預測,就跟博彩公司和體育臺的預測一樣,大家看一看,樂一樂,罵一罵就行了,大可不必當真。

2018 世界盃

高盛預測:巴西將奪冠雪恥

世界頂尖的投行高盛 (Goldman Sachs) 的經濟學家其實很無聊,所以他們每屆世界盃都會出來釋出一份《世界盃和經濟報告》,順便預測一下今年奪冠形勢。

高盛在小組賽階段預測的結果顯示:巴西最終奪冠的機率為 18.5%,高於法國 11.3% 和德國 10.7%。

西班牙和阿根廷表現低迷在四分之一決賽被淘汰;德國和巴西將分別在半決賽中擊敗葡萄牙和法國晉級。

你可能會記得加里·萊因克爾的語錄“足球就是一種由英國人發明,經過場上22個人激烈拼搶,苦戰90分鐘後,最後由德國人獲勝的運動!”然而這次它將無法應驗:高盛預測巴西將在決賽擊敗德國一雪前恥,勇奪大力神杯:

高盛用的同樣是隨機森林模型,只是用了更少的引數,嚴格限制在球隊和個人級別的指標上,基本上做了一個高階版的《足球經理》遊戲系統。

最後只有五個主要指標或者變數,相關性從高到低:球隊評級、球員評級、球隊近期表現、對手近期表現和球隊近期進球勢頭。

憑什麼說西班牙和阿根廷表現低迷?

做了 20 萬次模擬(比多特蒙德工業大學多了一倍)之後,高盛經濟學家認為抽籤導致西班牙和阿根廷在小組賽、淘汰賽就被迫面對強敵,而前面提到的五個指標打分,這兩隊在面對巴西和法國時表現不會太好。

下圖為 2014 和 2018 年高盛給各隊的打分:

今年,高盛認為得分最高的和去年一樣,是巴西隊。

然而高盛過去幾年的預測其實都挺歪的:比如 2010 年預測總決賽巴西對德國,結果奪冠的是西班牙;2014 年又說巴西會奪冠,而且概率高達 48.5%——哪想到巴西在半決賽被德國 7:1 血洗……

不知道今年的預測,會不會又是一口毒奶啊。

2018 世界盃

藝電預測:德國衛冕失敗,

點球大戰法國一球險勝

藝電 (Electronic Arts) 旗下擁有運動類遊戲大廠 EA Sports。你可能不知道的是,這家備受遊戲迷喜愛的廠牌,同時也是頂級比賽結果預測最準的機構……

在過去的 14 場美國職業橄欖球“超級碗”比賽裡,EA Sports 正確預測了 9 場的結果;說回世界盃,四年前,在一大票看好巴西隊的預測結果裡,EA Sports 特立獨行地選擇了德國。

上個月,EA Sports 宣佈了 2018 年世界盃的預測結果。今年,它選擇了法國作為冠軍,並且解釋了每一階段的預測過程,你可以通過這個連結詳細檢視: 

https://www.easports.com/fifa/news/2018/ea-sports-predicts-world-cup-fifa-18

EA Sports 估計,巴西將在四分之一階段被比利時送回老家,無緣復仇雪恥;法國和德國將分別擊敗烏拉圭和哥倫比亞;西班牙也將以 1:0 擊敗克羅埃西亞晉級四強;到了全歐洲陣容的半決賽階段,法國將 2:1 擊敗比利時,德國 3:1 擊敗西班牙。

最後的決賽,EA Sports 預測,德國和法國的對決將會十分精彩:高盧雄雞拖住了德國戰車的節奏,雙方在 90 分鐘內戰得難解難分,1:1 的比分將一直延續到加時賽結束,直到運氣將取代實力的地位,決定這場大戰的結果。最終,法國點球大戰 4:3 終結德國的衛冕之旅。

EA Sports 的預測機制跟前面兩家還是很不同的:它就是把最新的 2018 年世界盃各隊資料資料更新到了《FIFA 18》遊戲裡,然後跑了一個結果出來。

這個預測機制到底是什麼樣的,EA Sports 並沒有公開。上個月,《FIFA 18》遊戲加入了 2018 年世界盃模組,有遊戲的玩家可以自己更新一下資料,看看會出什麼結果;沒有遊戲的朋友,可以去 EA Sports 的網站,上面有一個預測模擬器,可以檢視官方在小組賽、淘汰賽等每一個階段的預測結果。

2018 世界盃

其他預測

看完了 AI 預測,也來看看電視臺、投行和博彩公司等傳統機構的預測結果吧。

ESPN 多數專家(下同):巴西

FOX Sports:巴西

BBC:德國

央視體育:巴西

瑞銀 UBS:德國

大部分博彩公司:巴西

你心目中的奪冠球隊是哪支或者哪幾支呢?歡迎在下面的評論裡告訴我們。



E/N/D

本文經授權轉載,

觀點不代表來Offer立場

更多科技求職資訊,請關注“來Offer”