【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了

“在足球領域,為何數據並非確定無疑的角度?為何數據統計無法呈現一切?數據統計的主觀程度如何?能否提供合適的範例?證明哪些球員雖然數據看似糟糕,但他們卻是球隊不可或缺的肱股?”


【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了


帶著這樣的思考,我們不妨來深入聊聊數據對足球的輔助作用,以及它們並不能反映足球比賽的本質。

數據分析並非萬能

足球是一項複雜的運動,很多年來,大多數人一直持這樣的觀點,即單靠乾巴巴、了無趣味和靈魂的數據,根本無法總結如此複雜的運動。近年來,這種觀點似乎不再流行——BBC的《比賽日(Match of the day)》欄目經常分析預期進球數據(xG),利物浦之所以獲得成功除了最佳的人員配置,也要感謝對數據的充分利用。

好吧,體育類文章要變得受讀者歡迎,最佳方案之一就是聘請一位致力於數據分析的專欄作家。

【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了


數據分析的廣泛應用,並沒有改變足球本身的複雜性。數據還會被用來陳述某種觀點,又或者贏得某場爭論,因為數據分析是提供證據、進而支持某種觀點的最佳方式。數據分析在足球(其他運動領域同樣如此)領域廣泛應用的原因,是缺乏更好的媒介從客觀的角度,支撐針對某支球隊或某個球員的觀點。

如果比賽的連續鏡頭更容易截取,而且版權持有者能夠放寬對視頻的使用,或許情況會有所不同。數據分析或許是客觀分析和探討比賽的最佳方式,但這並不意味著我們應當視其為真理。

首先,總會有某些東西是數據無法精確顯示的。比如誰是英超一腳停球最出色的球員?你也可以要求衡量某些相似的範疇,比如球員控球失誤後球權落到隊友腳下的比重。用fbref給出的數據,我們會發現阿斯頓維拉中衛恩格斯是整個英超第一腳停球最出色的球員——他接球時的停球的失誤率為0,略高於0.1%的衛範戴克。

【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了


然而,這種數據統計並沒有涉及到傳球的類型,以及球員接球時所處的環境等客觀條件。伯恩茅斯前鋒威爾遜的“控球失誤率”高達16%,為英超之首,但他接到傳球時絕大多數時間是在前場,受到後衛的壓迫自然非常嚴重。

此外,也很難判斷這些停球究竟是直接用腳停住,還是碰到脛骨、膝蓋後再落下來——停球失誤的數據參照點只有兩個選項,即“成功”和“失誤”,因此即便傳球類型或者所承受的壓力這兩大因素也考慮進去,計算出的結果,仍不足以判定究竟誰是英超一腳停球最出色的球員。

此外值得一提的是,雖然我們獲取的數據被認為是“絕對客觀”的,但其實同樣是有人手工採集的。問題是隻要有人的參與,就可能出現偏見和錯誤,乃至不理性的因素,所有這些都不應該與數據扯上關係。正因為這樣,目前所採集的數據中總會存在這樣那樣的錯誤,不管質量保證操作有多麼先進。

【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了


數據的採集過程中,不僅僅存在著人為的錯誤,還存在著因為不同尺度帶來的偏差。

從某種程度來講,無論Opta還是Statsbomb,又或者其他數據公司,都要給予他們想要採集的數據某種定義:什麼是傳球?什麼是直塞球?什麼是1對1?擋出和撲出有什麼區別?

判斷這些並不像區分黑白那麼簡單明瞭。

如果對針對上述問題的判斷進行探究,我們就會發現,創造數據採集過程(無論對象是足球或者其他範疇)時,主觀因素總會或多或少地起著作用。數據從來都不是毫無偏頗的,主觀性是數據採集不可避免的因素。

說這些並不是要質疑數據供給商,也不是說數據不足為信。數據採集本就是困難的過程,而數據採集的侷限性也意味著僅僅通過數據,並不能完全客觀地解讀足球。

糟糕的數據和優秀球員可以共存

有時候,某個球員數據糟糕,可能是因為對於其數據的錯誤理解。

就拿西漢姆聯中鋒阿萊為例吧。本賽季,他爭頂失敗的次數達到187次,為整個英超第2高,但爭頂成功的次數達到186次,為整個英超最高。

【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了


這兩項數據可能會被拿來判斷他爭頂能力的優劣,但更加準確的理解應該是他參與爭頂的次數極高,而且對於一名英超中鋒而言,他的爭頂成功率真的很高(根據smarterscout的統計,阿萊在陣地戰的爭頂成功率為82/99)。

謊言,數據有時候真的跟謊言相差不遠。

此外,球員數據糟糕的部分原因,是他們在球場上做了很多“份外之事”。上賽季薩里執教切爾西期間,若日尼奧的助攻數據欠奉,但很少有人站出來為他說話:助攻真的不是若鳥的首要任務。

【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了


作為切爾西的拖後組織核心,他最重要的任務是串聯前後場、控制節奏,以及將皮球第一時間輸送給能夠創造進球機會的隊友。他在這方面真的做得很棒——切爾西許多陣地進攻取得的進球,來源於若日尼奧的鋪墊,他參與球隊陣地進攻進球的次數為上賽季英超最高。

此外他的傳球次數也很多,根據Opta的預期助攻模板,他的助攻數應該達到5次。當然,這還需要考慮一些運氣因素。

本賽季,數據無法顯示球員整體能力的最佳典型,要數謝聯的麥戈德里克。

沒錯,在預期進球達到6.2個的情況下,麥戈德里克的聯賽進球數實際為0。如果主帥懷爾德看重的是他的進球能力,他早已經被踢出首發陣容。

【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了


然而,麥戈德里克的斷球次數卻是所有英超中鋒中最高的,而他的防守貢獻恰恰是確保其位置的關鍵因素,這也讓他成為球隊戰術體系中極為重要的環節。

數據分析不是一切

說白了,使用數據只是為了更好地理解足球這項複雜的運動,畢竟22名球員在1.5個小時內追著球瘋跑,想要解讀這樣的運動真的不容易。

在足球領域,最常見的數據設置自然是圍繞球本身完成的,這些數據往往能夠告訴你球本身發生了什麼(傳球、傳球、解圍、斷球、傳球、射門、進球),但它往往只涉及到控球球員,跟其他21個球員的關係真的不大。

【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了


正因為這樣,我們往往會錯過無球階段發生的事情。比如抓住對方防守空當的無球跑動,防守型中場阻斷對方威脅傳球路線的舉動等等。從這種角度而言,數據無法全面地捕捉球場上發生的一切,因為採集中存在著許多缺陷。

現階段,足球數據的一個最大的缺陷就是無法有效地衡量比賽中兩隊的防守。跟防守相關的數據(剷球、攔截以及搶斷等等)並不能作為我們判斷一名中衛優劣的依據,只能反映防守球員的積極性,又或者反映出該球員以及他所效力球隊的風格。我此前也曾經提到過,這些數據受到球隊控球比重的影響,更多的控球時間意味著用在防守端的時間更少。

對方每1000次觸球,阿斯頓維拉中衛明斯才有1次剷球嘗試,這個比重是英超所有中衛中最低的。但這並不意味著明斯是個糟糕的中衛,只能說明他並不願意積極地去拼搶球權。

【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了


通過數據,我們還能夠了解到明斯不俗的位置感,他是英超所有中衛中本賽季封堵射門次數最多的。維拉主帥迪恩-史密斯更喜歡將他放在較深的位置,作為球門的屏障,而不是讓他主動出擊去爭奪球權。

數據統計或許無法告訴我們一名後衛究竟有多麼出色,但作為這些統計基礎的原始數據,卻能夠起到出人意料的效果。使用這些數據來判斷中衛能力的最佳途徑,是將它作為某種標記,用來指明該中衛球員在比賽中可能會受到考驗的場合。這名中衛或許不是對方每次將傳中送入禁區時都會做出反應,但明眼人仍然能夠判斷出他反應的對與錯。通過這樣的片段,球探們能夠判斷出一名中衛表現的優劣,能夠對該中衛的實力形成主觀的判定。

【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了


目前,我們會採集失誤導致對方射門或者進球的數據,本賽季,在所有非門將球員當中,貝德納雷克是該數據最高的球員,由於他的失誤,送給比賽對手3個進球。而這些錯誤通常在外行人看來是不可思議的,比如腳後跟回傳門將力量太輕,導致被對方斷球繼而單刀破門。

這種錯誤出現的可能性較低,而且沒有一次是過於隨意導致的錯誤,也很難在同個賽季發生第二次,但它卻被認為是比較所有中衛的可靠依據。更理想的衡量方法,應該是捕捉那些導致對方進球的更為微妙的動作。

對方的每次射門和進球,自然是因為在防守環節中有人犯了錯誤。可能是後衛球員丟掉了自己盯防的人,或者是中場球員沒能阻斷對方的傳球線路,又或者是其他類似的錯誤。這些都是導致對方出現射門機會的重要因素,但現階段的數據統計形式無法有效地予以總結。

很可能一次丟球並不是因為某名球員的一次失誤,而是一連串錯誤綜合作用的結果。

【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了


儘管如此,事件數據和跟蹤數據的結合應該能夠打開一扇門,幫助我們回答這個問題以及其他類似的問題,但足球比賽的複雜性仍然遠超於此。

想象一下,某家數據供應商已經全面地破解了足球比賽,他們能夠採集到所有能夠想到的數據:針對某一球員的所有傳球選項,他們所承受壓力的大小,他們是否鬥志昂揚,無球隊友何時開始穿插跑動,他們是否繫好了鞋帶等等。

【名家專欄】還在迷信數據?足球要這麼簡單 球盲過濾器就失業了


擁有這樣豐富的數據,決定該衡量什麼已不再是問題,但在此基礎上,那些已經衡量過的內容,哪些才更加重要呢?

……

事實上,我們遠未達到這樣的高度,我們對發生在球場上的一切知之甚少,唯一不變的是我們要求衡量的、那些真正重要的範疇。

近年來,預期進球得到普遍應用,因為這個數據本身擁有足夠的描述及預期能力——我們因此瞭解到許多以往未曾瞭解的東西,也能夠將這一信息作為預測此後表現的信號。

簡而言之,就是數據分析會朝著無限還原比賽內容的方向前進,但在足球的複雜性面前,它還遠達不到“真理”的高度。


分享到:


相關文章: