跑動距離、撲救成功率、控球率……盤點十大誤導人的數據

英國網媒《運動家》作者Tom Worville撰文《足球分析的十大戒律》,盤點十大可能誤導人真正解讀比賽的數據。

跑動距離、撲救成功率、控球率……盤點十大誤導人的數據


1)不要用撲救成功率來評價守門員的能力

例子:本賽季,馬丁·杜布拉瓦卡撲救成功率達到73.9%,是英超第八好的門將。


為什麼會產生誤導:

撲救成功率=撲救次數/面對的射門次數。

問題來了,不同的守門員面對的射門類型和質量沒有體現在這個公式裡。

比如說,X門將在禁區內被射門10次,Y門將面對的是10腳禁區外的射門。如果他們各自撲出了6次,那麼兩人的撲救成功率都是60%,但顯然X門將遇到的挑戰更大。

用什麼數據代替:

在計算撲救成功率時引入xGOT(Expected Goals on Target),預期射正進球值,這個數值用來衡量一個機會被打進的困難與否,如果這個數值相對高則說明進球的概率越高,反之則越低。這項數據相比射門次數,會更考量射門的位置以及觸球部位。

如果一個守門員撲出了50%的必進球,那麼即使他撲救成功率只有50%,他依然是一個非常好的門將。而比如利物浦門將阿利松,他本賽季的表現就有些被高估,儘管他撲救成功率高達80.4%,排名英超第一,但如果綜合考慮進預期射正進球值,他的Goals Prevented是-1.3,也就是他比預期多丟了1.3個球,這1.3個球是質量平平的射門,他本該救出去的。

相反,沃特福德門將本福斯特的撲救成功率只有65.7%,但他的Goals Prevented是+6.2,他比預期多救出了6.2個本來大概率會打進的球。如果沒有他的表現,現在和降級區同分的沃特福德排名可能繼續往下降。


跑動距離、撲救成功率、控球率……盤點十大誤導人的數據


2)跑動距離或衝刺數據不代表努力程度

例子:厄齊爾今天比其他任何一個阿森納球員跑動距離都要多,達到了11.2公里。


為什麼會產生誤導:

英超俱樂部從2013-2014賽季開始引入追蹤數據,媒體大部分時候引用的是跑動距離和衝刺速度,而且用得很多。然而,和撲救成功率一樣,這兩項數據缺乏“語境”。

首先,贏球和跑動距離沒有直接聯繫。上賽季歐足聯關於歐冠聯賽的技術報告,頓涅茨克礦工是32支球隊中平均跑動距離最遠的,他們在小組賽排名第三,然後在歐聯杯32強被淘汰出局。曼聯的平均跑動距離是第二少的,但他們打進了八強。

其次,不斷告訴衝刺並不意味著就比別人快,很簡單,知道什麼時候使用自己的速度才是最重要的。要突破對方防線,有時候並不需要跑得比別人快,什麼時候啟動、從哪個角度突破才是關鍵。比起田徑比賽,足球更像是一個時間和空間的遊戲。

而且,你得綜合考慮進教練對球員的要求、球隊的打法、球隊的站位、比賽的形勢等等因素,跑動和衝刺兩項數據對球員的考慮作用才有意義。

最後,跑得更少,有時候可能反而更有效率——問問梅西。

用什麼數據代替:

目前還沒有很好的替代品,但除非這些數據在使用時被考量到“語境”,否則意義並不大。


3)控球率意義不大

例子:熱刺在0比1輸給紐卡斯爾的比賽中控球率高達79.8%,這是2003-2004賽季以來英超輸球一方控球率第二高的。


為什麼會產生誤導:

Marti Perarnau在關於瓜迪奧拉的《Pep Confidential》一書中寫到,控球率只是達到目的的一種方式,是一個工具,而不是目標。

控球率是一項使用頻率很高的數據,但這項數據並沒有什麼意義。2015-2016賽季萊斯特城以平均42.6%的控球率贏得英超冠軍,上賽季曼城奪冠控球率是67.7%。

隨著比賽形勢的不同,控球率會不斷變化。馬競主場1比0擊敗利物浦的比賽,他們第4分鐘就取得1比0的領先,因此他們最後控球率只有27%。如果沒有早早進球的話,形勢顯然會不同。

用什麼數據代替:

控球率可以告訴你哪一隊持有球權更多,但並不能用來證明哪一隊比另一隊更好,或是更應該贏得比賽。如果要分析哪支球隊更值得贏得比賽,xG(Expected Goals),預期進球值會是一個更好的數據,它體現的是一支球隊創造了多少大概率可以進球的機會。


4)不要用搶斷次數來判斷一個球員的防守能力

例子:裡卡多·佩雷拉是英超最好的後衛,本賽季共搶斷119次。


為什麼會產生誤導:

並不是所有球員的防守都是有形的,而且這項數據可能受球隊風格的影響。比如一支球隊控球少,那麼他們自然會有更多的機會剷搶,反之亦然。

範戴克每90分鐘只搶斷0.76次,但沒有人會認為他是一個糟糕的防守隊員。

用什麼數據代替:

為了更好比較不同隊員的防守能力,可以把數據擴大到對手在場上每1000次觸球時,該球員搶斷了多少次。利物浦中場亨德森每90分鐘搶斷2.6次,英超中場第15名,但把數據範圍擴大後,對手每1000次觸球,他能搶斷4.6次,是英超這項數據第五好的中場球員。


5)不要用攔截成功率來判斷球員的搶斷能力

為什麼會產生誤導:

這項數據忽略了搶斷的時候對方犯規或是自己搶斷成功後製造犯規的次數。目前英超搶斷成功率最高的邊後衛是馬丁·凱利,高達80%。萬比薩卡,光是看比賽大家都會覺得他應該在頂尖行列,但他的攔截成功率只排在第11。

如果引入兩個犯規數據的話,真實攔截成功率=攔截次數/(攔截次數+攔截失敗次數+攔截時被吹罰犯規次數),那麼萬比薩卡的真實攔截成功率是78.9%,英超邊後衛第一,而馬丁·凱利的排名變成了第29。


6)小樣本的情況下,不要用預期進球值衡量前鋒

例子:菲爾米諾的預期進球值是12.7個進球,但實際上他本賽季英超只打進了8球,他是一個糟糕的終結者。


產生誤導的原因:

這項數據更適合用來評判一支球隊創造機會的能力,即使跨度達到一個賽季,對於某個球員的預期進球值來說,依然只是小樣本。菲爾米諾此前在利物浦的三個賽季,第一個賽季進球數比預期進球值高,第二個賽季低,第三個賽季高。


7)不要用一個球員缺席時的勝率來衡量他的作用

例子:本賽季阿森納在沒有厄齊爾的情況下勝率達到40%,比他出場時球隊的勝率(28%)高。


產生誤導的原因:

WOWY,With or Without You,更適合更小範圍的運動,比如籃球,籃球的陣容變化更多,得分更多,單個球員對比賽產生的影響力就更大。

足球運動參與人數更多,而且有更多偶然的因素,比如厄齊爾出場的比賽中,他的球員狀態如何,有紅牌嗎,厄齊爾在比賽中被換下了嗎?WOWY這項數據體現不出這些問題。

又比如伯恩利的本·梅伊和塔爾科夫斯基都踢滿了球隊本賽季每一分鐘的比賽,他們誰表現更好?誰對球隊做出了更大的貢獻?WOWY這項數據無法告訴我們。

用什麼數據代替:

更好的辦法是根據球員的位置,用更細緻的數據來分析他們,專注他們的任務。比如評價厄齊爾,顯然是要評估他的創造了,那考量的數據就應該是創造了多少機會。如果是評價一個前鋒,那就是進球數、預期進球值等等。


8)不要用傳球成功率來判斷一個球員的傳球能力

例子:菲爾·巴德斯利是英超傳球最差的後衛,傳球成功率只有63.6%。


為什麼會產生誤導:

球員傳球的準確率,取決於他們被要求做什麼,以及他們在控球時做出的選擇。

比如曼城,大部分時候大部分區域,在壓力很少的情況下,他們傾向於使用短傳。其他球隊,比如伯恩利,會更常使用長傳。

還有些球員,他會被要求更多進行挑戰性的直塞,失敗率自然要比安全的短傳給身邊的隊友高,但不能說他的傳球能力就差。


9)次數不重要,轉化率更重要

例子:阿諾德傳球不成功的次數比英超任何一個其他球員都多。


為什麼會產生誤導:

金靴獎得主每個賽季的進球次數都不會比射門失敗的次數多,但沒關係,失敗次數並不重要,更重要的數據是轉化率。

比起關注阿諾德失敗的次數,更重要的是,他是大部分傳球都失敗了嗎?還是因為他比其他任何球員都嘗試了多得多的傳球?


10)不要將出場時間不同的球員進行比較

例子:阿諾德和麥迪遜並列英超創造機會第二多的球員,均創造了75次。


為什麼會產生誤導:

很簡單,上場時間長的球員有機會進行更多的嘗試。

可以調整為每90分鐘的統計數據來比較。通過這個調整,諾維奇的埃米布尼亞每90分鐘創造3.3次機會,實際上是英超第二好的機會創造者,麥迪遜是2.8次,而阿諾德則是2.6次。


跑動距離、撲救成功率、控球率……盤點十大誤導人的數據


©TheAthletic《The 10 Commandments of football analytics》


分享到:


相關文章: