【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

作者/Tom Worville

翻译/远风(笔者在pp体育发表的翻译文章)


“在足球领域,为何数据并非确定无疑的角度?为何数据统计无法呈现一切?数据统计的主观程度如何?能否提供合适的范例?证明哪些球员虽然数据看似糟糕,但他们却是球队不可或缺的肱股?”

【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

带着这样的思考,我们不妨来深入聊聊数据对足球的辅助作用,以及它们并不能反映足球比赛的本质。

数据分析并非万能

足球是一项复杂的运动,很多年来,大多数人一直持这样的观点,即单靠干巴巴、了无趣味和灵魂的数据,根本无法总结如此复杂的运动。近年来,这种观点似乎不再流行——BBC的《比赛日(Match of the day)》栏目经常分析预期进球数据(xG),利物浦之所以获得成功除了最佳的人员配置,也要感谢对数据的充分利用。

好吧,体育类文章要变得受读者欢迎,最佳方案之一就是聘请一位致力于数据分析的专栏作家。

【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

数据分析的广泛应用,并没有改变足球本身的复杂性。数据还会被用来陈述某种观点,又或者赢得某场争论,因为数据分析是提供证据、进而支持某种观点的最佳方式。数据分析在足球(其他运动领域同样如此)领域广泛应用的原因,是缺乏更好的媒介从客观的角度,支撑针对某支球队或某个球员的观点。

如果比赛的连续镜头更容易截取,而且版权持有者能够放宽对视频的使用,或许情况会有所不同。数据分析或许是客观分析和探讨比赛的最佳方式,但这并不意味着我们应当视其为真理。

首先,总会有某些东西是数据无法精确显示的。比如谁是英超一脚停球最出色的球员?你也可以要求衡量某些相似的范畴,比如球员控球失误后球权落到队友脚下的比重。用fbref给出的数据,我们会发现阿斯顿维拉中卫恩格斯是整个英超第一脚停球最出色的球员——他接球时的停球的失误率为0,略高于0.1%的卫范戴克。

【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

然而,这种数据统计并没有涉及到传球的类型,以及球员接球时所处的环境等客观条件。伯恩茅斯前锋威尔逊的“控球失误率”高达16%,为英超之首,但他接到传球时绝大多数时间是在前场,受到后卫的压迫自然非常严重。

此外,也很难判断这些停球究竟是直接用脚停住,还是碰到胫骨、膝盖后再落下来——停球失误的数据参照点只有两个选项,即“成功”和“失误”,因此即便传球类型或者所承受的压力这两大因素也考虑进去,计算出的结果,仍不足以判定究竟谁是英超一脚停球最出色的球员。

此外值得一提的是,虽然我们获取的数据被认为是“绝对客观”的,但其实同样是有人手工采集的。问题是只要有人的参与,就可能出现偏见和错误,乃至不理性的因素,所有这些都不应该与数据扯上关系。正因为这样,目前所采集的数据中总会存在这样那样的错误,不管质量保证操作有多么先进。

【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

数据的采集过程中,不仅仅存在着人为的错误,还存在着因为不同尺度带来的偏差。

从某种程度来讲,无论Opta还是Statsbomb,又或者其他数据公司,都要给予他们想要采集的数据某种定义:什么是传球?什么是直塞球?什么是1对1?挡出和扑出有什么区别?

判断这些并不像区分黑白那么简单明了。

如果对针对上述问题的判断进行探究,我们就会发现,创造数据采集过程(无论对象是足球或者其他范畴)时,主观因素总会或多或少地起着作用。数据从来都不是毫无偏颇的,主观性是数据采集不可避免的因素。

说这些并不是要质疑数据供给商,也不是说数据不足为信。数据采集本就是困难的过程,而数据采集的局限性也意味着仅仅通过数据,并不能完全客观地解读足球。

糟糕的数据和优秀球员可以共存

有时候,某个球员数据糟糕,可能是因为对于其数据的错误理解。

就拿西汉姆联中锋阿莱为例吧。本赛季,他争顶失败的次数达到187次,为整个英超第2高,但争顶成功的次数达到186次,为整个英超最高。

【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

这两项数据可能会被拿来判断他争顶能力的优劣,但更加准确的理解应该是他参与争顶的次数极高,而且对于一名英超中锋而言,他的争顶成功率真的很高(根据smarterscout的统计,阿莱在阵地战的争顶成功率为82/99)。

谎言,数据有时候真的跟谎言相差不远。

此外,球员数据糟糕的部分原因,是他们在球场上做了很多“份外之事”。上赛季萨里执教切尔西期间,若日尼奥的助攻数据欠奉,但很少有人站出来为他说话:助攻真的不是若鸟的首要任务。

【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

作为切尔西的拖后组织核心,他最重要的任务是串联前后场、控制节奏,以及将皮球第一时间输送给能够创造进球机会的队友。他在这方面真的做得很棒——切尔西许多阵地进攻取得的进球,来源于若日尼奥的铺垫,他参与球队阵地进攻进球的次数为上赛季英超最高。

此外他的传球次数也很多,根据Opta的预期助攻模板,他的助攻数应该达到5次。当然,这还需要考虑一些运气因素。

本赛季,数据无法显示球员整体能力的最佳典型,要数谢联的麦戈德里克。

没错,在预期进球达到6.2个的情况下,麦戈德里克的联赛进球数实际为0。如果主帅怀尔德看重的是他的进球能力,他早已经被踢出首发阵容。

【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

然而,麦戈德里克的断球次数却是所有英超中锋中最高的,而他的防守贡献恰恰是确保其位置的关键因素,这也让他成为球队战术体系中极为重要的环节。

数据分析不是一切

说白了,使用数据只是为了更好地理解足球这项复杂的运动,毕竟22名球员在1.5个小时内追着球疯跑,想要解读这样的运动真的不容易。

在足球领域,最常见的数据设置自然是围绕球本身完成的,这些数据往往能够告诉你球本身发生了什么(传球、传球、解围、断球、传球、射门、进球),但它往往只涉及到控球球员,跟其他21个球员的关系真的不大。

【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

正因为这样,我们往往会错过无球阶段发生的事情。比如抓住对方防守空当的无球跑动,防守型中场阻断对方威胁传球路线的举动等等。从这种角度而言,数据无法全面地捕捉球场上发生的一切,因为采集中存在着许多缺陷。

现阶段,足球数据的一个最大的缺陷就是无法有效地衡量比赛中两队的防守。跟防守相关的数据(铲球、拦截以及抢断等等)并不能作为我们判断一名中卫优劣的依据,只能反映防守球员的积极性,又或者反映出该球员以及他所效力球队的风格。我此前也曾经提到过,这些数据受到球队控球比重的影响,更多的控球时间意味着用在防守端的时间更少。

对方每1000次触球,阿斯顿维拉中卫明斯才有1次铲球尝试,这个比重是英超所有中卫中最低的。但这并不意味着明斯是个糟糕的中卫,只能说明他并不愿意积极地去拼抢球权。

【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

通过数据,我们还能够了解到明斯不俗的位置感,他是英超所有中卫中本赛季封堵射门次数最多的。维拉主帅迪恩-史密斯更喜欢将他放在较深的位置,作为球门的屏障,而不是让他主动出击去争夺球权。

数据统计或许无法告诉我们一名后卫究竟有多么出色,但作为这些统计基础的原始数据,却能够起到出人意料的效果。使用这些数据来判断中卫能力的最佳途径,是将它作为某种标记,用来指明该中卫球员在比赛中可能会受到考验的场合。这名中卫或许不是对方每次将传中送入禁区时都会做出反应,但明眼人仍然能够判断出他反应的对与错。通过这样的片段,球探们能够判断出一名中卫表现的优劣,能够对该中卫的实力形成主观的判定。

【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

目前,我们会采集失误导致对方射门或者进球的数据,本赛季,在所有非门将球员当中,贝德纳雷克是该数据最高的球员,由于他的失误,送给比赛对手3个进球。而这些错误通常在外行人看来是不可思议的,比如脚后跟回传门将力量太轻,导致被对方断球继而单刀破门。

这种错误出现的可能性较低,而且没有一次是过于随意导致的错误,也很难在同个赛季发生第二次,但它却被认为是比较所有中卫的可靠依据。更理想的衡量方法,应该是捕捉那些导致对方进球的更为微妙的动作。

对方的每次射门和进球,自然是因为在防守环节中有人犯了错误。可能是后卫球员丢掉了自己盯防的人,或者是中场球员没能阻断对方的传球线路,又或者是其他类似的错误。这些都是导致对方出现射门机会的重要因素,但现阶段的数据统计形式无法有效地予以总结。

很可能一次丢球并不是因为某名球员的一次失误,而是一连串错误综合作用的结果。

【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

尽管如此,事件数据和跟踪数据的结合应该能够打开一扇门,帮助我们回答这个问题以及其他类似的问题,但足球比赛的复杂性仍然远超于此。

想象一下,某家数据供应商已经全面地破解了足球比赛,他们能够采集到所有能够想到的数据:针对某一球员的所有传球选项,他们所承受压力的大小,他们是否斗志昂扬,无球队友何时开始穿插跑动,他们是否系好了鞋带等等。

【名家专栏】还在迷信数据?足球要这么简单 球盲过滤器就失业了

拥有这样丰富的数据,决定该衡量什么已不再是问题,但在此基础上,那些已经衡量过的内容,哪些才更加重要呢?

……

事实上,我们远未达到这样的高度,我们对发生在球场上的一切知之甚少,唯一不变的是我们要求衡量的、那些真正重要的范畴。

近年来,预期进球得到普遍应用,因为这个数据本身拥有足够的描述及预期能力——我们因此了解到许多以往未曾了解的东西,也能够将这一信息作为预测此后表现的信号。

简而言之,就是数据分析会朝着无限还原比赛内容的方向前进,但在足球的复杂性面前,它还远达不到“真理”的高度。


分享到:


相關文章: