2023 非预期传球成功率：衡量足球运动员创造力的指标 un-xPass: Measuring Soccer Player’s Creativity¶

摘要¶

创造力在足球运动员中备受重视。它有助于产生激动人心且难以预测的比赛表现,帮助球队突破防守战术并创造得分机会。因此,评估球员的创造力是球员招募过程中的重要环节。然而,目前尚无明确的方法来衡量足球运动中的创造力。传统的基于结果的绩效指标无法捕捉创造力,因为创造性不仅要做有用的事,还要以独特或非典型的方式完成有用的事。因此,本文提出了一种新的指标来量化球员传球中的创造力水平。我们的创造性决策评分(CDR)利用机器学习技术评估两个重要因素:传球的原创性,以及其在提升球队进球机会方面的价值。我们在2021/22赛季英格兰超级联赛的StatsBomb 360情境事件流数据上验证了该指标,并通过多个应用案例表明,它为球员技能提供了另一视角,是对现有球员评估指标的有益补充。总体而言,我们的指标提供了一种简明的方法来捕捉和量化足球运动员的创造力,可能对该项运动的球员招募和人才培养具有重要意义。

1 引言¶

定量分析在足球运动员招募过程中发挥着日益重要的作用[2, 7, 34]。详细数据的广泛获取和大量研究促成了新指标的产生,这些指标能够更客观、更全面地反映球员的能力和潜力。如今,球队越来越多地使用这些指标来辅助评估球员的技术[8, 28]、身体[19, 26]、战术[9, 10]和心理[3]能力。教练、球探和球迷高度重视的另一项技能是创造力,在足球运动中,它指的是球员针对对方球队所构成的难题提出新颖且富有想象力的解决方案的能力。由于创造型球员的存在能够增强球队瓦解严密防守和创造进球机会的能力[16],研究者[23]和从业者[5]都强调创造力是成功的重要因素。在球迷中,最优秀的足球运动员也常被形容为"富有创造力"。例如,凯文·德布劳内被普遍认为是创造力大师。尽管创造力备受重视,但以往研究尚未利用统计模型对其进行客观量化。这是因为创造力通常被视为一种无形的品质,一种无法通过统计进行分析的东西。在心理学中,创造力通常被定义为"既新颖(即出乎意料、独创)又恰当(即有用)的产出能力"[23]。因此,创造力不仅涉及完成有用的事情,还要以独特或非典型的方式完成。例如,回切传球几乎总能将球员置于良好的得分位置。然而,它通常不被认为具有创造性,因为在比赛状态允许的情况下,它通常是最直接的选择。在本文中,我们在足球运动背景下将这一心理学定义操作化,提出创造性动作应当:(1)不同于绝大多数球员在给定比赛状态下会选择的典型动作,(2)比这种典型选择具有更有前景的结果。基于此,我们提出了一种新的传球创造性决策评分(CDR)指标。CDR为每次传球赋予一个数值,该数值是所选传球方案的期望值与预测的典型传球期望值之差。为了计算CDR,我们需要三个估计值:每个可能传球目标的可能性、每个传球方案的长期回报以及每个传球方案的成功概率。我们使用机器学习方法从StatsBomb 360事件流数据中学习这些组成部分的模型。该数据描述了比赛期间执行的所有控球动作,并增加了每个标注事件发生时刻的球员位置快照¹。

¹ 有关数据的详细说明,请参见https://statsbomb.com/what-we-do/soccer-data/360-2/。本研究中使用的部分数据可在https://github.com/statsbomb/open-data公开获取。

尽管针对传统事件流数据和时空跟踪数据已经开发了上述三个组成部分的模型,但混合型360数据带来了独特的挑战。我们将比较学习各个独立模型的两种方法:基于手工特征的梯度提升树模型和基于SoccerMap架构[12]的深度学习卷积神经网络模型。为了验证我们的指标,我们计算了2021/22赛季英格兰超级联赛的CDR,结果显示凯文·德布劳内确实是最具创造力的球员,其次是塔里克·兰普提和特伦特·亚历山大-阿诺德。在考察球员组合时,我们发现穆罕默德·萨拉赫和萨迪奥·马内之间的配合表现出最高的创造力。此外,我们发现创造力的平均水平不受比赛状态(即剩余时间和比分差距)的影响,但创造力的方差随着时间的推移而增加。综上所述,本文做出以下贡献:

(1) 我们提出了一种新的指标CDR,用于捕捉足球运动中创造力这一复杂概念;

(2) 我们比较了深度学习方法和基于特征的方法,用于从StatsBomb 360数据中的球员位置快照估计(i)每个可能传球目标的可能性、(ii)每个传球方案的长期回报以及(iii)每个传球方案的成功概率;

(3) 我们展示了多个应用案例,并突出了从我们的指标中得出的最有趣的发现;

(4) 我们发布了一个Python包(可在https://github.com/ML-KULeuven/un-xPass获取),该包实现了CDR指标并支持构建底层的机器学习模型。

本文的其余部分组织如下:第2节介绍了我们用于衡量球员传球选择创造力的指标。接下来,第3节介绍了实验设置,第4节详细描述了用于学习支撑我们指标的机器学习组件的方法。第5节提供了关于我们指标在实践中表现的见解,并展示了我们最有趣的发现。第6节讨论了相关工作。最后,第7节总结全文并概述了未来研究的潜在方向。

2 测量创造性传球¶

我们对创造力的定义要求量化动作的两个方面:

(1) 有用性,与动作如何影响球队的进球机会相关

(2) 原创性,与绝大多数球员在给定比赛状态下会选择的传球相关

在描述了如何对这两者建模之后,我们将展示如何将两者结合起来测量创造力。我们的方法基于事件流数据,该数据描述了比赛期间观察到的控球动作,如传球、盘带和射门。每个动作用一个属性元组\(ai\)描述,包含动作类型、比赛中发生的时间、起点和终点位置、执行动作的球员以及用于执行动作的身体部位。

2.1 评估动作的有用性¶

在考虑事件流数据时,一场足球比赛可以被视为\(n\)个连续动作\(a₁, a₂, ..., aₙ\)的序列。每个动作\(aᵢ\)的结果\(oᵢ ∈ \{成功, 失败\}\)将比赛从状态\(Sᵢ₋₁ = \{a₁, ..., aᵢ₋₁\}\)转移到状态\(Sᵢ = \{a₁, ..., aᵢ₋₁, aᵢ\}\)。因此,捕捉动作有用性的合理方法是测量动作前比赛状态\(Sᵢ₋₁\)与动作后比赛状态\(Sᵢ\)之间的质量差异。近年来,基于这一思想引入了若干绩效指标(例如xT [30]、VAEP [8]、g+ [17]、PV [21]、OBV [31])。从宏观层面来看,它们都按照以下方程量化动作的有用性(\(U\)):

\[ U(A = a, O = o |S) = Q(S |A = a, O = o) − Q(S), \]

其中\(Q\)捕捉特定比赛状态的价值或质量。通常,该质量用进球或失球的可能性来表示。因此,\(U\)捕捉了执行特定动作后得分概率的变化。这种评估动作有用性的典型方法基于整体视角。然而,在原子层面,每个动作包含三个部分:

动作选择。首先,球员必须从一组选项中选择最佳动作。这涉及在当前比赛状态的范围内,选择采取哪种动作类型(例如传球、盘带、射门)以及如何准确实施("执行")该动作(例如射门时瞄准哪个角)。

动作执行。其次,球员必须尝试成功完成该动作。然而每个球员的技术能力不同[14],这将影响动作的实施。

动作结果。第三,球员的决策和执行转化为结果。通常,这些结果由队友(例如接传球的球员)或对手(例如扑救射门的守门员)决定。

我们认为创造力属于动作选择阶段,因此试图将结果抽象化²。因此,我们将动作的期望有用性计算为两种结果价值的加权和:

\[ \mathbb{E}[U(A = a|S)] = ∑_{o ∈ \{o⁺,o⁻\}} P(O = o |A = a, S) · U(A = a, O = o), \]

其中\(P(O = o⁺|A = a, S)\)是动作\(a\)在比赛状态\(S\)下成功的概率,\(P(O = o⁻|A = a, S)\)是其失败的概率。

² 显然,球员需要将创造力与技术能力结合才能产生影响。我们将在第5.2节讨论这一点。

2.2 评估动作的原创性¶

创造力的第二个方面涉及动作选择的原创性。一般而言,在足球运动中,球员在持球时可以执行三种可能的高层次动作:球员可以尝试射门、传球给队友或带球推进。在本文中,我们将可能动作空间A限制为传球,因为这是与创造力最密切相关的动作类型。

更具体地说,我们通过传球\(aᵢ ∈ A\)的起点和终点来表征它。起点对应于球的当前位置,包含在当前比赛状态中。终点可以根据球员身份(即传球给特定球员)或场地上的位置来定义。为了能够区分传向特定球员位置的简单传球和球员应该跑向的(通常更具创造性的)直塞球,我们在本研究中选择第二种方法。因此,设L为足球场上所有可能位置的集合。那么,我们可以将\(Dᵢ\)定义为传球\(aᵢ\)所选择的传球目标位置,将\(P(D = l |S)\)定义为传向任何位置\(l ∈ L\)的传球转移概率模型。最后,球员传球选择决策的原创性可以定义为补数\(1 − P(D = l |S)\)。

2.3 评估动作的创造力¶

通过比较所选传球的期望有用性与比赛状态允许的其他典型传球的期望有用性,我们现在可以评估球员是否正在执行导致更有前景结果的意外动作,从而体现创造力的概念。我们的直觉是,在任何比赛状态下,很少会有多个明显的高价值传球选项,而职业足球运动员都是选择此类选项的专家。因此,通常只需将所选传球与预测的最可能传球选项\(l_{typical} = arg\ max_{k∈L} P(D = k |S)\)进行比较即可。结合这些见解,我们将在比赛状态\(S\)下传向位置\(D = l\)的传球的创造性决策评分(\(CDR\))定义为:

\[ CDR(D = l |S) = \mathbb{E}[U(D = l |S)] − \mathbb{E}[U(D = l_{typical}|S)]. \]

由于所选动作和最典型动作具有相同的动作前比赛状态,这简化为:

\(= \mathbb{E}[U(D = l |S)] − \mathbb{E}[U(D = l_{typical} |S)]\) \(=(\mathbb{E}[Q(S |D = l)] − \mathbb{E}[Q(S)]) − (\mathbb{E}[Q(S |D = l_{typical})] − \mathbb{E}[Q(S)])\) \(= \mathbb{E}[Q(S |D = l)] − \mathbb{E}[Q(S |D = l_{typical})]\) \(= ∑_{o ∈ \{o⁺,o⁻\}} P(O = o |D = l, S) · Q(S |D = l, O = o) − ∑_{o ∈ \{o⁻,o⁺\}} P(O = o |D = l_{typical}, S) · Q(S |D = l_{typical}, O = o)\)

这引导我们估计三个组成部分,当组合时可产生对传球创造力的单一估计:

(1) 传球选择\(P(D = l |S)\):对传向场上其他每个位置的传球可能性的估计。

(2) 传球成功\(P(O = o |D = l, S)\):对传向场上其他每个位置的传球成功概率的估计。

(3) 传球价值\(Q(S |D = l, O = o, S)\):对传向场上其他每个位置的成功或失败传球之后的比赛状态价值的估计。

每个组成部分都可以利用标准的监督机器学习流程进行估计,在该流程中,给定描述比赛状态的一些输入特征,我们可以训练一个模型,为球场上的每个位置生成一个介于0和1之间的概率。接下来的两节将详细描述我们训练这些模型的方法。

3 实验设置¶

在本节中,我们描述了用于推断和评估每个模型组件的数据集和实验设置。

3.1 数据¶

我们基于StatsBomb 360事件流数据构建数据集。这类数据从广播视频中提取,由增强了球员位置快照的常规人工标注事件流数据组成。我们使用该事件流的SPADL表示[8]。360快照在每个控球动作发生时记录,包括视频中可见的所有球员的位置以及与持球球员的关系(即队友或对手)。根据我们的模型设计,我们仅关注传球。此外,我们舍弃了非脚部执行的传球、源自定位球情况的传球(即我们舍弃角球、任意球、球门球、开球和界外球),以及起点或终点位置落在360快照之外的传球。通过应用这些标准,我们从2020年欧洲足球锦标赛以及2020/21赛季英格兰超级联赛前10名球队的数据中创建了包含118,758次传球的训练数据集。随机抽取其中20%的传球用作模型选择的验证集。从2021/22赛季英格兰超级联赛前10名球队中提取的93,631次传球的数据集被单独用于评估模型和开发应用案例。

3.2 模型选择和设置¶

一个关键的设计选择涉及如何表示比赛状态。一种方法是利用专家知识手工创建有意义的特征[8, 28]。这种方法提供可解释性,并利用我们对比赛的理解和洞察。另一种方法是使用纯数据驱动的方法来学习比赛情况的良好表示[11, 13, 18]。前者通常用于建模事件流数据,而后者常用于建模完整的空间跟踪数据。由于尚不清楚哪种方法最适合混合型360事件流数据,我们比较了两类模型:基于SoccerMap [12]架构的深度学习模型和基于手工特征的XGBoost [6]模型。SoccerMap架构是一种全卷积网络架构,受深度射流非线性特征层次[20]的启发。给定球和球员当前位置的张量表示,该网络可以通过纯数据驱动的方式进行训练,以产生关于未来动作和结果的位置级预测(即覆盖足球场全部范围的104 × 68概率曲面)。不同分辨率层的组合允许在局部和全局层面捕获有关当前比赛状态的相关信息,使模型能够做出尊重全局结构的局部预测。我们使用PyTorch Lightning框架和自适应矩估计(ADAM)算法训练SoccerMap模型。我们对学习率(\(1e−3, 1e−4, 1e−5, 1e−6\))和批量大小参数(16, 32, 64)进行网格搜索。对于传球成功概率模型,我们使用patience设置为10个epoch、delta为\(1e−3\)的早停策略;对于传球选择和传球价值模型,使用delta为\(1e−5\)的早停策略。对于所有XGBoost模型,我们应用树结构Parzen估计器(TPE)算法来优化最大树深度([1, 9])、学习率(\([1e−2, 0.25]\))、L1正则化(\([1e−8, 100]\))、L2正则化(\([1e−8, 100]\))以及在叶节点上进行进一步分区所需的最小损失减少(\([1e−8, 1]\))。我们使用patience设置为100轮提升的早停策略。为了获得覆盖足球场全部范围的概率曲面,我们模拟传向每个\(l × h\)网格单元的传球,并计算相应的特征表示。然后将每个模拟传球的预测映射到相应的网格单元。出于计算原因,我们使用更粗的26 × 17网格,然后使用双线性插值进行放大。

4 模型组件的推断¶

在本节中,我们提供了计算动作创造性决策评分所需的机器学习组件的详细描述和实证评估。在对这些组件的评估中,我们解决以下四个研究问题:

Q1 分析事件流数据(即基于领域知识的特征)和跟踪数据(即数据驱动的深度学习)通常使用不同的输入数据表示。这些方法中哪一种最适合从StatsBomb 360事件流数据中学习?

Q2 估计传球选择概率曲面需要对所有其他球员的可能未来位置进行推理。StatsBomb 360数据中提供的不完整球员位置上下文是否足以获得合理准确的估计?

Q3 传球的终点位置是估计传球成功概率的重要特征。应该如何处理失败传球的未知(预期)终点位置?

Q4 先前的研究建议使用预期进球(xG)值而非二元进球/未进球标签来估计进球概率,但这两种方法尚未进行过比较。

4.1 传球选择¶

如第2节所述,我们的目标是估计传向场上其他每个位置(例如图1)而非特定球员的传球概率。估计这样一个完整的传球选择概率曲面需要一个能够在整个足球场上进行全局校准的细粒度局部预测的模型,这对于XGBoost模型来说难以实现。因此,我们使用SoccerMap来实现这一组件。目标输出是一个稀疏矩阵,其中在每个观察到的传球对应的目标位置给定值1。作为输入,我们使用以下九个通道,这些通道改编自[13]:

通道A和B:两个稀疏矩阵,分别包含进攻球队和防守球队的球员位置。
通道C和D:两个密集矩阵,包含每个位置到球和球门的距离。
通道E和F:两个密集矩阵,包含每个位置与球位置之间角度的正弦和余弦值
通道G:一个密集矩阵,包含每个位置与球门之间的角度。
通道H和I:两个稀疏矩阵,包含球速度矢量的两个分量,由事件数据中前两个动作期间的时间戳和球位置导出。这些通道给出球运动方向的指示。

**图1:**一个示例比赛情况的传球选择概率曲面(对数尺度),其中紫色代表更可能的传球目标。蓝色和红色圆圈分别代表进攻球队和防守球队的球员位置。蓝队控球并从左向右进攻。白色箭头表示所选传球。

图1:一个示例比赛情况的传球选择概率曲面(对数尺度),其中紫色代表更可能的传球目标。蓝色和红色圆圈分别代表进攻球队和防守球队的球员位置。蓝队控球并从左向右进攻。白色箭头表示所选传球。

由于缺乏估计完整传球选择曲面的其他方法,我们将结果与预测最可能接球者的方法进行比较。首先,我们建立了一个朴素基线,始终预测最近的队友为最可能的接球者。其次,我们训练了一个XGBoost排序分类器,基于360快照中每个传球选项的以下手工特征集来预测给定球员实际上是可能传球的接球者的可能性:起点和终点位置、传球距离、传球角度、起点和终点处的射门角度、终点处最近防守球员的距离,以及最近防守球员到起点与终点之间直线的距离。每次传球中,一个数据点接收正标签(实际接球者),所有其他数据点标记为零。

表1展示了基线模型和SoccerMap模型在测试数据上的结果。为了允许基于位置的SoccerMap模型与基于接球者的基线模型之间进行比较,我们将SoccerMap模型预测曲面中的最可能接球者计算为距离最可能传球目标最近的队友,并将准确率计算为正确预测接球者的传球百分比。SoccerMap模型的准确率仅略低于基于特征的模型。不过应该注意的是,将基于位置的预测映射到球员会引入额外的误差,特别是对于在距离球员当前位置较远处进行的传球。因此,XGBoost模型和SoccerMap模型之间准确率的实际差异可能小于评估所反映的差异。基于这些结果以及对估计的传球选择概率曲面的视觉检查(例如图1),我们得出结论:我们可以足够准确地预测每个可能传球目标的可能性。

**表1:**传球选择组件的三种替代实现的平均损失和准确率:(1)预测最近队友为最可能接球者的朴素基线,(2)基于手工特征的XGBoost模型,(3)基于SoccerMap架构的深度学习模型。

表1:传球选择组件的三种替代实现的平均损失和准确率:(1)预测最近队友为最可能接球者的朴素基线,(2)基于手工特征的XGBoost模型,(3)基于SoccerMap架构的深度学习模型。

4.2 传球成功概率¶

对于估计传球成功,我们根据StatsBomb使用的成功定义,定义了一个二项分布的结果。也就是说,到达不越位队友的传球被标记为"成功"。所有出界或被拦截的传球被标记为"失败"。关于建模传球成功,一个重要的注意事项是传球的预期目标位置仅对成功传球已知。失败传球的终点位置被记录为球被拦截或出界的位置。因此,不可能为尝试的传球构建准确的特征表示。先前的研究通过两种方式解决了这个问题:(1)忽略该问题并假设大多数传球将在其预期目标附近被拦截[12],(2)基于传球方向和潜在接球者的位置估计预期接球者[1, 27]。估计预期接球者的方法范围从简单的基于距离的规则到建模球轨迹和球员移动的高级物理方法[1]。由于360快照缺乏关于球员和球速度的信息,我们遵循Power等人[27]的方法,将预期接球者估计为距离球被拦截位置最近且与传球线角度最小的球员:

如果预测的接球者位于场地边界之外,我们将其坐标截断到场地的最近边界。如果没有球员在传球线的20°范围内,我们假设预期接球者未包含在快照中,并继续使用观察到的终点位置。图2说明了这一过程。然而,估计预期接球者有一些明显的局限性。首先,当预期接球者未包含在360快照中、当球在飞行路径早期被阻挡、当球被偏转或当两名球员彼此靠近时,估计将不准确。此外,尝试传球的终点位置被替换为传球时预期接球者的(x,y)坐标。实际上,传球通常在接球者前方进行,以便其跑向球。我们实现了三个简单的基于位置的梯度提升树模型来评估识别预期接球者的优势是否超过局限性:(i)与接球者无关:一个基线模型,其中我们仅使用传球的起点;(ii)观察到的终点位置:我们同时使用观察到的传球起点和终点位置;(iii)预期的终点位置:我们用最可能接球者的坐标替换传球的终点位置。我们在这些模型中使用到球门的距离和角度以及到边线的距离作为特征,而不是原始坐标。此外,我们通过传球距离(总距离和沿两个轴的距离)和角度来描述传球起点和终点位置之间的关系。

**图2:**预期接球者(绿色圆圈)被识别为距离球被拦截或出界位置(红色圆圈)最近且与传球线角度最小的队友。只有传球线20°范围内(灰色区域)的球员被视为潜在的预期接球者。

图2:预期接球者(绿色圆圈)被识别为距离球被拦截或出界位置(红色圆圈)最近且与传球线角度最小的队友。只有传球线20°范围内(灰色区域)的球员被视为潜在的预期接球者。

我们的结果表明,使用预期终点位置几乎没有优势。首先,我们可以观察到使用观察到的终点位置更准确(表2)。不过,我们假设这是因为观察到的终点位置往往会暴露传球的结果。例如,观察到的终点位置在边线上或在起点1米半径内的传球很可能是失败的传球。更重要的是,使用预期终点位置会对直塞球产生不准确的估计,因为当它们失败时会被映射到球员位置。例如在图3中,使用预期终点位置的模型预测对手禁区大部分区域的先验概率,因为训练数据中没有该位置存在潜在接球者的示例。使用观察到的终点位置的主要缺点是,接近传球起点的位置被赋予非常低的成功概率,这可能是由于传球被阻挡。鉴于这些结果,我们在观察到的终点位置基础上进一步构建,并使用事件流中可用的属性扩展基于位置的特征集:

(1) 球的高度(地面、肩部高度、肩部以上); (2) 控球序列中前两个动作期间的速度(覆盖距离/时间); (3) 传球者在尝试传球前的控球时间。

此外,我们从360快照中提取特征,描述传球者、接球者和球轨迹周围的情况:

**图3:**使用与接球者无关的模型、在每次传球观察到的终点位置上训练的模型以及在估计的预期终点位置上训练的模型,从蓝色圆圈位置开始到所有其他位置的传球成功概率曲面。

图3:使用与接球者无关的模型、在每次传球观察到的终点位置上训练的模型以及在估计的预期终点位置上训练的模型,从蓝色圆圈位置开始到所有其他位置的传球成功概率曲面。

(4) 最近防守球员到传球者和接球者的距离; (5) 最近防守球员到连接传球位置和接球者位置的直线的距离; (6) 传球路径中的对方球员数量,其中路径定义为传球起点和接球者位置之间的三角形走廊,在接球者位置处底边为1米。

这些特征受到Szczepański和McHale [33]、Anzer和Bauer [1]、Goes等人[15]以及Power等人[27]最近工作的启发。除了基于特征的模型外,我们再次学习了一个SoccerMap深度学习模型。作为输入,我们使用前一节定义的通道A到G。最后,我们建立了一个朴素基线,为所有传球分配平均传球完成率。如表2所示,使用完整手工特征集的XGBoost模型总体表现最佳。

**表2:**传球成功概率组件的三种替代实现的性能:(1)预测平均传球完成率的朴素基线,(2)基于手工特征的XGBoost模型,(3)基于SoccerMap架构的深度学习模型。

表2:传球成功概率组件的三种替代实现的性能:(1)预测平均传球完成率的朴素基线,(2)基于手工特征的XGBoost模型,(3)基于SoccerMap架构的深度学习模型。

4.3 传球价值¶

最后两个组件对应于完成传球和失败传球的期望有用性,这归结为估计比赛状态的价值。已有若干方法被引入来捕捉比赛状态的价值[8, 13, 29],但通常它们估计在不久的将来进球(即进攻价值)或失球(即防守价值)的可能性。我们为比赛状态价值的这些进攻和防守组成部分训练了两个独立的模型;

然而,我们对两种情况使用等效的架构。这使我们能够在更高的粒度级别检查模型的预测。然后,总的比赛状态价值通过两个模型估计值的差值获得。我们将进攻价值定义为在接下来10个动作中进球的概率;相应地,防守价值定义为在接下来10个动作中失球的概率[8]。由于进球罕见且提供微弱的学习信号,先前的研究提出使用xG值来训练控球价值模型[17, 32]。因此,我们利用StatsBomb的xG值来确定接下来10个动作中任何射门的进球可能性。如果这10个动作的序列包含多次射门,我们将其xG值组合为

\[ xG_{seq} = 1 − ∏_{shot∈seq} (1 − xG_{shot}). \]

这对应于取防守球队不允许从一系列射门中进球的概率的补数。我们的结果(表3)表明,在xG值上训练的模型确实比在二元进球/未进球变量上训练的模型提供更准确的估计。

**表3:**进攻传球价值组件的五种替代实现的性能:(1)基于位置的预期威胁(xT)框架,(2)基于事件数据的VAEP框架在二元进球/未进球标签上训练,(3)在xG值上训练,(4)使用从360快照提取的特征在xG值上训练的VAEP框架,(5)基于SoccerMap架构的深度学习模型。所有模型仅在完成的传球上使用二元进球/未进球标签进行评估。

表3:进攻传球价值组件的五种替代实现的性能:(1)基于位置的预期威胁(xT)框架,(2)基于事件数据的VAEP框架在二元进球/未进球标签上训练,(3)在xG值上训练,(4)使用从360快照提取的特征在xG值上训练的VAEP框架,(5)基于SoccerMap架构的深度学习模型。所有模型仅在完成的传球上使用二元进球/未进球标签进行评估。

各种比赛状态价值模型之间的关键区别在于它们考虑的上下文信息量。最基本的方法仅考虑球的位置[29, 30, 36],而中间方法利用可以从传统事件流数据中提取的更多上下文信息[8, 17, 21, 31],最先进的方法从跟踪数据中提取详细的空间表示,考虑所有球员的位置[13]。然而,据我们所知,尚不存在基于360数据估计比赛状态价值的公开模型³,360数据可以被视为完整时空跟踪数据的有限版本,因为它仅提供球员位置的部分视图,并且缺乏关于球员和球速度和加速度的信息。我们再次使用一组基于手工特征的XGBoost模型和基于SoccerMap架构的深度学习模型进行实验。作为基线,

³ 此外,StatsBomb的专有控球价值(OBV)指标尚未使用360快照。

我们考虑基于位置的预期威胁(xT)[30]⁴和基于事件数据的VAEP [8]框架。对于XGBoost模型,我们使用从360数据中提取的特征扩展VAEP的比赛状态表示,这些特征捕捉被突破球员的数量和球的可拦截性。被突破球员的数量使用Impect的包夹率的简化版本计算:如果防守球员在向前传球之前位于球和球门之间,但在传球之后距离球门比球更远,则该防守球员被视为被突破。对于可拦截性,我们使用传球终点位置周围3米和5米半径内的防守球员数量。对于SoccerMap模型,我们使用前面描述的七个输入通道(A-G),以及两个密集矩阵,分别包含传球到每个位置后将被突破的控球球队和对方球队的球员数量。

我们需要完成传球和失败传球的期望价值。由于传球结果是VAEP比赛状态表示中的一个特征,因此可以通过修改特征值来获得完成传球和失败传球的价值。对于SoccerMap模型,我们在完成传球和失败传球上学习独立的模型。为简单起见,我们仅在表3中报告所有进攻比赛状态价值模型在完成传球上的性能。

⁴ https://karun.in/blog/expected-threat.html

5 应用案例¶

我们现在展示通过计算2021/22赛季英格兰超级联赛的CDR指标得出的若干观察结果。首先,我们展示最具创造力球员的排名,并量化他们的创造力如何与技术能力配合。其次,我们考察球员组合之间互动的创造力。第三,我们寻找球员位置与创造力之间的关系。第四,我们考察比赛状态对创造力的影响。

5.1 最具创造力的球员¶

表4展示了我们数据集中按每90分钟创造性决策评分(CDR90)排名的前10名球员。为了获得稳健的排名,我们仅纳入根据第3节定义的标准至少完成250次传球的球员。凯文·德布劳内位居榜首,塔里克·兰普提紧随其后。利物浦的右后卫特伦特·亚历山大-阿诺德位列第三。球员传球的创造力和数量之间存在天然的张力。图4说明了这一点,该图显示了球员平均每90分钟执行的传球次数(数量)与这些动作的平均创造力的函数关系。原因有两方面。首先,执行更多传球的球员通常处于更偏防守的位置,推进球所需的创造力较少。例如,哈里·凯恩的平均CDR非常高,但作为前锋尝试的传球相对较少。其次,如果球员执行大量传球,那么每次传球都具有高价值就更加困难。然而,如虚线等值线所示,像凯文·德布劳内、塔里克·兰普提、特伦特·亚历山大-阿诺德、拉菲尼亚和哈基姆·齐耶赫这样的球员将高创造力与大量传球结合在一起。

**表4:**2021/22赛季英格兰超级联赛中至少完成250次传球的球员中,按我们的创造性决策评分(CDR)排名的前10名球员,已根据上场时间标准化。

表4:2021/22赛季英格兰超级联赛中至少完成250次传球的球员中,按我们的创造性决策评分(CDR)排名的前10名球员,已根据上场时间标准化。

5.2 创造力与技术能力的结合¶

我们的创造力指标奖励尝试非典型传球的球员,而不考虑传球的结果。虽然这使得能够对球员的创造力进行细粒度评估,但它忽略了球员表现评估的重要部分。为了评估球员是否将视野与成功完成其尝试传球的技术能力相结合,我们应用了Bransen等人[3]提出的执行评分指标。他们的指标将传球的技术执行质量衡量为传球的观察结果(例如,传中是否到达队友)与基于执行传球的情境预测的传球成功概率之间的差异。形式上,执行评分(ER)

**图4:**散点图对比球员的平均创造性决策评分(CDR)与每90分钟执行的平均传球次数。虚线等值线显示了排名靠前的球员与其他球员之间的差距。仅包括在2021/22赛季英格兰超级联赛中至少完成250次传球的球员。

图4:散点图对比球员的平均创造性决策评分(CDR)与每90分钟执行的平均传球次数。虚线等值线显示了排名靠前的球员与其他球员之间的差距。仅包括在2021/22赛季英格兰超级联赛中至少完成250次传球的球员。

定义为

其中,如果传球成功,\([o⁺]\)取值为\(1\),否则为\(0\),\(P(O = o |D = l, S)\)由前一节的动作成功预测器给出。直观地说,该指标奖励成功执行困难传球的球员,惩罚搞砸简单传球的球员。图5比较了按球员分组的传球的平均CDR和ER。总体而言,我们发现球员的创造能力和技术能力之间没有强相关关系。执行评分主要由球员的位置决定,防守型中场得分最高,前锋得分最低。我们认为这是因为对于进攻球员来说,失去控球的后果不那么严重。因此,他们可以承受更多错误。

**图5:**2021/22赛季英格兰超级联赛中每位球员的平均创造性决策评分与执行评分之间的关系。

图5:2021/22赛季英格兰超级联赛中每位球员的平均创造性决策评分与执行评分之间的关系。

5.3 最具创造力的组合¶

我们创造力指标的一个局限是它将所有功劳归于传球的球员。然而,通常是接球的球员通过溜入空档使传球成为可能。因此,表5考察了在相互传球中表现出最高创造力的球员组合。不出所料,排名最高的组合在场上共同度过了许多时间,并且彼此完全协调。穆罕默德·萨拉赫和萨迪奥·马内领衔利物浦的进攻已有五个赛季,而哈里·凯恩和孙兴慜是托特纳姆热刺的出色组合。

**表5:**2021/22赛季英格兰超级联赛中每次互动的创造性决策评分(CDR)最高的球员组合。仅包括至少有50次互动的组合。

表5:2021/22赛季英格兰超级联赛中每次互动的创造性决策评分(CDR)最高的球员组合。仅包括至少有50次互动的组合。

5.4 创造力与位置之间的联系¶

富有创造力通常与组织核心或"10号位"的角色相关,这个位置通常在进攻型中场的位置上运作。图6显示,在这个位置上运作的球员确实在我们的创造力指标上得分很高。然而,我们发现边锋平均而言是2021/22赛季英超最具创造力的球员。这个位置在近年来对进攻组织核心来说变得更加

普遍。例如,梅西通常从进攻边路位置运作。另一个趋势是将边后卫用作组织核心。塔里克·兰普提和特伦特·亚历山大-阿诺德就说明了这一点,他们根据我们的指标都跻身最具创造力球员之列。

**图6:**按球员在场上的位置分组的每次传球的平均创造性决策评分。深绿色反映更高的创造力。CM和SS位置的数据不足。关于各位置的定义,我们参考StatsBomb的数据规范指南。

图6:按球员在场上的位置分组的每次传球的平均创造性决策评分。深绿色反映更高的创造力。CM和SS位置的数据不足。关于各位置的定义,我们参考StatsBomb的数据规范指南。

有趣的是,我们发现左翼和右翼之间存在很大的不平衡,右翼的创造力明显更高。应该对其他联赛进行进一步研究,以确定这是否可以推广,还是应该归因于2021/22赛季英超的球员选择。

5.5 创造力与比赛状态的关系¶

剩余时间和比分差距对平均CDR都没有明显影响(图7)。然而,随着时间的推进,创造力的方差增加,特别是在伤停补时阶段。这可能归因于疲劳以及球队在比赛临近结束时采取更多防守冒险。这创造了额外的空间,可以通过创造性传球来利用。然而,随着球员变得更加疲劳,这也导致更多"错失"的创造性机会。

**图7:**按15分钟时间间隔(上)和比分差距(下)分组的创造性决策评分分布。负的比分差距对应于控球球队落后。
**(a) 剩余时间的影响
(b) 比分差距的影响**

图7:按15分钟时间间隔(上)和比分差距(下)分组的创造性决策评分分布。负的比分差距对应于控球球队落后。 (a) 剩余时间的影响 (b) 比分差距的影响

6 相关工作¶

创造力及其在团队运动中的重要性主要在体育科学文献中进行研究[5, 16, 23]。特别是对于足球,Kempe和Memmert [16]表明成功的球队使用更多高度创造性的动作来进球。然而,这些研究中对创造力的评估主要通过心理评估[25, 35]或专家对球员每个动作的评分[22, 24]进行。显然,这种方法不具有可扩展性。创造力可以被视为决策的一个方面,通常评估为动作风险和回报之间的权衡[4, 15, 27]。例如,Goes等人[15]和Power等人[27]基于传球成功传给队友的可能性(即风险),以及如果成功将在多大程度上增加好事发生(例如进球)的机会(即回报)来评估传球。虽然我们的创造力指标建立在这些风险-回报框架之上,但风险和回报都不符合人们直观上认为能够捕捉创造力的标准。捕捉创造力需要加入原创性的概念,并对动作的实际结果进行抽象。

7 结论¶

本文介绍的创造力指标是捕捉足球运动员创造能力这一复杂概念的第一步。利用这一指标,可以在总体上以及各种场景中比较球员的创造力。这可以在球探过程中为俱乐部和分析师提供有价值的信息。该指标主要侧重于基于与典型传球选择的偏差以及与这些选择相关的期望价值来量化创造力。虽然它可以捕捉非典型或意外的动作,但不明确考虑这些动作背后的潜在原因,如习惯或个人偏好。这种局限在更广泛的足球分析领域很普遍,缺乏球员特定模型阻碍了将个人球员特征与球队动态和战术分离的能力。为了解决这一局限并更好地理解习惯与创造力之间的相互作用,未来的研究可以探索纳入球员特定模型的方法。此外,我们的未来计划包括将创造力指标扩展到其他动作类型,特别是射门和盘带。目前,该指标倾向于低估在射门或盘带是更典型选择的比赛状态下传球的创造力。通过将传球选择模型扩展为动作选择模型,可以克服这一局限,从而能够评估不同动作类型的创造力。最后,我们打算探索评估典型动作价值的替代方法。尽管当前选择最可能传球的方法在实践中效果良好,但当多次传球同样可能时,它可能产生不准确的结果。

致谢¶

本研究获得了佛兰德斯政府(人工智能研究计划)、佛兰德斯研究基金会(EOS No. 30992574)和鲁汶大学研究基金(iBOF/21/075)的资助。我们感谢StatsBomb提供本研究中使用的数据。

参考文献¶

[1] Gabriel Anzer and Pascal Bauer. 2022. Expected passes. Data Mining and Knowledge Discovery 36, 1 (Jan. 2022), 295–317. https://doi.org/10.1007/s10618-021-00810-3

[2] Ryan Beal, Timothy J. Norman, and Sarvapali D. Ramchurn. 2019. Artificial intelligence for team sports: a survey. The Knowledge Engineering Review 34 (2019), e28. https://doi.org/10.1017/S0269888919000225

[3] Lotte Bransen, Pieter Robberechts, Jan Van Haaren, and Jesse Davis. 2019. Choke or Shine? Quantifying Soccer Players' Abilities to Perform Under Mental Pressure. In MIT Sloan Sports Analytics Conference. 1–25.

[4] Borja Burriel and Javier M. Buldú. 2021. The quest for the right pass: Quantifying player's decision making. In Proceedings of the StatsBomb Innovation in Football Conference. StatsBomb, London, United Kingdom, 1–22. http://statsbomb.com/wp-content/uploads/2021/11/Javier-M-Buldu.pdf

[5] Jean-Michel Bénézet and Hansruedi Hasler. 2018. Youth Football Training Manual. https://digitalhub.fifa.com/m/1b3da6976c9290aa/original/mxpozhvr2gjshmxrilpf-pdf.pdf

[6] Tianqi Chen and Carlos Guestrin. 2016. XGBoost: A Scalable Tree Boosting System. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (San Francisco, California, USA) (KDD '16). ACM, New York, NY, USA, 785–794. https://doi.org/10.1145/2939672.2939785

[7] Tom Decroos. 2020. Soccer analytics meets artificial intelligence: learning value and style from soccer event stream data. Ph. D. Dissertation. KU Leuven.

[8] Tom Decroos, Lotte Bransen, Jan Van Haaren, and Jesse Davis. 2019. Actions speak louder than goals: Valuing player actions in soccer. In Proceedings of the 25th ACM SIGKDD international conference on knowledge discovery and data mining (KDD '19). ACM, New York, NY, USA, 1851–1861. https://doi.org/10.1145/3292500.3330758

[9] Tom Decroos and Jesse Davis. 2020. Player vectors: Characterizing soccer players' playing style from match event streams. In Proceedings of the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases. Springer International Publishing, Cham, 569–584.

[10] Tom Decroos, Maaike Van Roy, and Jesse Davis. 2021. SoccerMix: representing soccer actions with mixture models. In Machine Learning and Knowledge Discovery in Databases. Applied Data Science and Demo Track. Springer International Publishing, Cham, 459–474.

[11] Uwe Dick and Ulf Brefeld. 2019. Learning to rate player positioning in soccer. Big data 7, 1 (2019), 71–82. https://doi.org/10.1089/big.2018.0054

[12] Javier Fernández and Luke Bornn. 2021. SoccerMap: A Deep Learning Architecture for Visually-Interpretable Analysis in Soccer. In Machine Learning and Knowledge Discovery in Databases. Applied Data Science and Demo Track, Yuxiao Dong, Georgiana Ifrim, Dunja Mladenić, Craig Saunders, and Sofie Van Hoecke (Eds.). Springer International Publishing, Cham, 491–506.

[13] Javier Fernández, Luke Bornn, and Daniel Cervone. 2021. A framework for the fine-grained evaluation of the instantaneous expected value of soccer possessions. Machine Learning 110, 6 (2021), 1389–1427.

[14] Leon Forcher, Leander Forcher, Sascha Härtel, Darko Jekauc, Hagen Wäsche, Alexander Woll, Timo Gross, and Stefan Altmann. 2022. Does Technical Match Performance in Professional Soccer Depend on the Positional Role or the Individuality of the Player? Frontiers in Psychology 13 (2022), 2847. https://doi.org/10.3389/fpsyg.2022.813206

[15] Floris Goes, Edgar Schwarz, Marije Elferink-Gemser, Koen Lemmink, and Michel Brink. 2022. A risk-reward assessment of passing decisions: comparison between positional roles using tracking data from professional men's soccer. Science and Medicine in Football 6, 3 (July 2022), 372–380. https://doi.org/10.1080/24733938.2021.1944660

[16] Matthias Kempe and Daniel Memmert. 2018. "Good, better, creative": the influence of creativity on goal scoring in elite soccer. Journal of Sports Sciences 36, 21 (Nov. 2018), 2419–2423. https://doi.org/10.1080/02640414.2018.1459153

[17] Matthias Kullowatz. 2020. Goals added: Deep Dive Methodology. American Soccer Analysis. Retrieved May 22, 2023 from https://www.americansocceranalysis.com/home/2020/5/4/goals-added-deep-dive-methodology

[18] Guiliang Liu, Yudong Luo, Oliver Schulte, and Tarak Kharrat. 2020. Deep soccer analytics: learning an action-value function for evaluating soccer players. Data Mining and Knowledge Discovery 34, 5 (2020), 1531–1559.

[19] Sergio Llana, Borja Burriel, Pau Madrero, and Javier Fernández. 2022. Is it worth the effort? Understanding and contextualizing physical metrics in soccer. arXiv:2204.02313 [stat.ML]

[20] Jonathan Long, Evan Shelhamer, and Trevor Darrell. 2015. Fully Convolutional Networks for Semantic Segmentation. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, New York, NY, USA, 3431–3440. https://doi.org/10.1109/CVPR.2015.7298965

[21] Nils Mackay. 2019. Introducing a possession value framework. Stats Perform. Retrieved May 22, 2023 from https://www.statsperform.com/resource/introducing-a-possession-value-framework

[22] Daniel Memmert. 2010. Testing of tactical performance in youth elite soccer. Journal of Sports Science & Medicine 9, 2 (2010), 199.

[23] Daniel Memmert. 2015. Teaching tactical creativity in sport: Research and practice. Routledge, Abingdon, UK. https://doi.org/10.4324/9781315797618

[24] Daniel Memmert and Klaus Roth. 2007. The effects of non-specific and specific concepts on tactical creativity in team ball sports. Journal of Sports Sciences 25, 12 (Oct. 2007), 1423–1432. https://doi.org/10.1080/02640410601129755

[25] Thomas Morris. 2000. Psychological characteristics and talent identification in soccer. Journal of Sports Sciences 18, 9 (Jan. 2000), 715–726. https://doi.org/10.1080/02640410050120096

[26] José M. Oliva-Lozano and José M. Muyor. 2022. Understanding the FIFA quality performance reports for electronic performance and tracking systems: from science to practice. Science and Medicine in Football 6, 3 (2022), 398–403. https://doi.org/10.1080/24733938.2021.1984557

[27] Paul Power, Hector Ruiz, Xinyu Wei, and Patrick Lucey. 2017. Not All Passes Are Created Equal: Objectively Measuring the Risk and Reward of Passes in Soccer from Tracking Data. In Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '17). Association for Computing Machinery, New York, NY, USA, 1605–1613. https://doi.org/10.1145/3097983.3098051

[28] Pieter Robberechts and Jesse Davis. 2020. How Data Availability Affects the Ability to Learn Good xG Models. In Workshop on Machine Learning and Data Mining for Sports Analytics at ECML/PKDD 2020 (MLSA). Springer International Publishing, Cham, 17–27.

[29] Sarah Rudd. 2011. A Framework for Tactical Analysis and Individual Offensive Production Assessment in Soccer Using Markov Chains. In New England Symposium on Statistics in Sports. http://nessis.org/nessis11/rudd.pdf

[30] Karun Singh. 2019. Introducing Expected Threat (xT). Retrieved May 22, 2023 from https://karun.in/blog/expected-threat.html

[31] StatsBomb. 2020. Introducing On-Ball Value. Retrieved May 22, 2023 from https://statsbomb.com/articles/soccer/introducing-on-ball-value-obv/

[32] StatsBomb. 2021. On Ball Value. Technical Report.

[33] Łukasz Szczepański and Ian McHale. 2016. Beyond completion rate: evaluating the passing ability of footballers. Journal of the Royal Statistical Society. Series A (Statistics in Society) 179, 2 (2016), 513–533. http://www.jstor.org/stable/43965554

[34] Karl Tuyls, Shayegan Omidshafiei, Paul Muller, Zhe Wang, Jerome Connor, Daniel Hennes, Ian Graham, William Spearman, Tim Waskett, Dafydd Steel, et al. 2021. Game Plan: What AI can do for Football, and What Football can do for AI. Journal of Artificial Intelligence Research 71 (2021), 41–88.

[35] Torbjörn Vestberg, Roland Gustafson, Liselotte Maurex, Martin Ingvar, and Predrag Petrovic. 2012. Executive Functions Predict the Success of Top-Soccer Players. PLoS one 7, 4 (April 2012), e34731. https://doi.org/10.1371/journal.pone.0034731

[36] Derek Yam. 2019. Attacking Contributions: Markov Models for Football. StatsBomb. Retrieved May 22, 2023 from https://statsbomb.com/articles/soccer/attacking-contributions-markov-models-for-football/