MCM2020D
我们主要分析2020美赛D题O奖论文2013245这篇文章,其中的图片均采用该篇论文上的图片。
1. 摘要
团队合作可以解决个人难以处理的复杂问题,因此提高团队效率是有意义的。从传球网络出发,分析了哈士奇的典型合作结构,建立了滑动窗口模型,确定了适合哈士奇的合作模式,并提出了战略调整建议。
首先,以足球运动员为节点,以传球为弧线,建立有向球流网络;我们选择网络中所有大于5的通道结构作为合作结构,并为其设置特征向量。根据特征向量值,采用层次聚类的平均联动方法对路径进行聚类,采用主成分分析法对路径进行降维。
最后,我们从网络中提取了6种典型的策略模式,并分析了它们的结构特征。
其次,我们选择平均节点连通性、传递性等指标来衡量团队合作。我们建立了一个滑动窗口模型来描述比赛过程中各项性能指标的变化,该模型设置了一个900秒(1/3-半场时间)的滑动窗口。窗口是比赛的分时子图,可以精确地捕捉到当时球队的配置和动态策略滑动高亮时段的位置。
第三,分析了哈士奇在突出表现时经常使用的结构,我们发现哈士奇更倾向于使用防守反击策略。哈士奇通常在中前场和后场表现较好,但在中后场表现很差。因此,我们建议哈士奇延续长传冲孔模式,使用4-4-2阵型。
最后,我们发现增强团队结构的灵活性和建立本地协调结构有利于提高团队效率。有必要对主要的团队联系方式进行细化和分析。当整体指标难以详细解释时,滑动窗口的想法可能会有用。如果我们能够获得更多关于成功团队特征的信息,我们也许能够建立一个更通用的模型来衡量团队绩效。
关键词:网络,合作结构,滑动窗口模型,团队策略
2. 问题重述
从本赛季的比赛数据来看,我们的主队哈士奇表现不太好。他们的教练邀请我们来探讨他们的互动是如何产生最终结果的。不同类型的团队风格和策略对团队绩效的影响很大,有时甚至是一种约束。因此,我们也会根据过去的不足,为下赛季哈士奇的成绩提出建议。
问题1要求我们根据传递的数据创建一个网络。我们用节点和边分别表示球员和球的传球路线。传球路线的数量反映了球员在比赛中的重要性。此外,箭头的方向显示了球员的功能,如前进和中心。我们在空间和时间维度上识别网络的模式。
问题2要求我们探索成功团队的指标,除了分数和胜利。我们简要总结了几个指标来描述哈士奇的性能,尽管最终的结果。所有索引都来自完整的事件数据。总共有三十八支火柴。我们只用其中的一半来建立模型。后半部分用来评估模型的普适性。
问题3要求我们给哈士奇的教练一些建议。我们分析问题1的网络,并考虑所有的成功指标。球队风格主要有3种,防守风格、进攻风格和平衡风格。我们将根据对手的水平提供结构战术。当团队与低水平的对手竞争时,由于对抗较少甚至没有对抗,运动员往往有更多的空间和时间来应用技术。由于玩家能够及时地进行观察和判断,所以一项技术的成功率比较高。相反,高水平的对手在空间和时间上压迫着我们的球员。他们强大的防守能力导致了我们技术成功率的下降。
问题4要求我们扩大模型的使用范围。随着专业化进程的普及,团队合作在社会上得到了极大的普及。因为我们有评估协同工作系统效果的功能,所以很容易选出最佳组合。我们概括了大量优秀团队的特征;然后给出了一个通用的团队合作模型。
3. 建模假设
- 所有队伍均可以在比赛中全力以赴。不管其他因素如天气,客场等的影响,足球运动员技术水平保持不变。
- 比赛绝对公平,不考虑假球,黑哨等因素影响。
- 球员充分贯彻教练战术和策略
4. 模型的相关介绍
4.1 问题1模型——流动网络模型
基于球员传球数据建立有向的球流动网络,用圆圈表示球员,圆圈大小表示该节点的度大小,两节点间连线宽度为两球员之间的传球通过次数。这样建立14名玩家之间的传球网络分析不同球员的联系程度。下图表示第一场比赛中哈士奇队14名球员组成的网络图。
4.2 确定合作模型——层次聚类法
首先我们确定合作模型的特征向量$[\overline{X},\overline{Y},\text{avg}(\sqrt{(\Delta
x_i)^2+(\Delta y_i)^2}),\rho,N,\overline{T}]$。其中$\overline{X}$与$\overline{Y}$表示事件发生的平均X与Y轴的位置, $\text{avg}(\sqrt{(\Delta x_i)^2+(\Delta
y_i)^2})$表示平均的传球距离,ρ表示传球的次数,N表示传球者的数量,$\overline{T}$表示传球平均时长,反映了传球的快慢。
之后我们利用距离是欧几里得距离进行层次聚类,并利用主成分分析进行降维,利用方差达到95%的两个维度可以得到下图。
聚类所得到的的结果图如下,可以得到6个类别,我们将之考虑为6个合作模型,用不同颜色表示。
并且6种合作模式的平均数据可以计算如下图表示,第一张图表示各种合作模式的数据,第二张图表示各种合作模式发生的位置以及范围大小。
4.3 表现评估——滑动窗口模型
4.3.1 选取的特征
- 平均节点连通量$\overline{k}(G)$,即平均的节点流量大小。节点平均连通性反映了玩家之间的协调,如果团队中的每个成员都有较高的参与度,那么平均连通性就较高。它能反映出球员是否广泛参与,如果有球员单独参与,该值会变低。这也显示了球员贡献的比较。如果全队只把球传给几个明星球员打,而不是一起打,该值就低。
- 配合次数Transitivity。足球比赛是通过巧妙的战术配合来获得更多的进攻机会,而不断变化的战术配合始终离不开三人的配合。计算方式为Transitivity=时间范围内网络中三条边均连接的三角形数量加上三条边连接两条的三角形数量。
4.3.2 滑动窗口模型
滑动窗口的大致过程如上所示。随着窗口在游戏时间轴上滑动,右侧会不断添加新的传球,同时,左侧也会丢弃一些传球时间。在窗口内部的事件会影响窗口的两个特征的输出结果。
由于标准的足球比赛持续时间大约为90分钟,5400秒。一般足球运动员在15分钟后进入比赛状态。因此,采用900秒(即中场休息的$\frac{1}{3}$时间,15分钟)作为滑动窗口的大小。
5. 结展示与分析
5.1 问题2的解答
5.1.1 6种合作模式
我们对问题2中得到的6种合作模式进行分析。
第1,2种合作模式发生在对手的球门旁边,平均传球距离与平均传球次数并不突出,但花费的平均时间很短,在突破敌方防线后哈士奇队可以利用这两种合作模型来找到射门机会。
第3种合作模式为防守模式,该模式花费较长的平均通过距离与时间,即后卫通过后场传球来调整节奏或是减缓对手的猛烈进攻。
第4种合作模式出现次数较少,只有7次,其中能力强的明星球员为核心,整个结构几乎包括所有球员,只有在完全控制住球的情况下才可能出现。
第五种合作模式为中场调整模式,这种模式使用频率最高,可以调整中场时团队的节奏,在球员寻找进攻机会时使用。
第六种合作模式为后卫调整模式,该模式为防守能力高的选手组成对对方的进攻进行防守。
5.1.2 流动网络模型中两个特征分析
首先是平均节点连通量,下图是哈士奇队2:0对手的一局比赛中平均节点连通量,可以看见哈士奇队的高光时刻表现明显多于对手,且对手的高光时刻表现也没那么长,比赛结果可以对此进行验证。
其次是配合次数,配合次数反映的主要是玩家的灵活度。下图是哈士奇队0:4败于对手的一局比赛,由于比赛过程中几乎所有段哈士奇队的配合次数均小于对手,因此很容易解释这样的结果。
5.2 问题3的解答——哈士奇队的结构策略
下图是在6种合作模式下哈士奇队与其他队伍的对比情况。
从第一幅图可以看到,合作模式3与合作模式5哈士奇队使用最多,其分别表示中场整体规划与防御模式。因此可以推断哈士奇队在本赛季经常使用防守反击策略,球员们等待机会,当时机成熟,可轻松长传让前锋控制球并射门。
第二幅图显示哈士奇队与其他对手在高光时期合作模式上的差异。可以看到哈士奇队在合作模式2,3,5上表现较好。当哈士奇队使用它们时容易产生高光时刻。
以下我们给出建议:
- 加强发展反击与长传的技巧,以产生最好的结果。
- 从高光时刻分析来看,合作模式2的表现高于赛季的平均水平,而使用次数较少,应适当增加合作模式2出现的次数。
- 阵容采用防守反击阵容4-4-2
10
5.3 问题4的解答——如何建立更好的团队
- 设计高效团队的关键要素 设计一个有效的团队,首先应该找到团队合作的基本模式。团队成员之间的协作乍一看可能显得凌乱,很难找到有用的信息。所以找到团队成员之间合作的典型特征就显得格外重要。就像本文分析的足球队一样,球员在场上有各种各样的动作,而传球是球员之间最常见、最典型的互动,所以我们可以先分析传球信息。同理,这种思考方式可以拓展到其他球队。 在思考团队策略时,除了考虑参数指标的整体变化外,利用窗口捕捉每个时刻指标的变化,可能会给出更有启发性的结论。利用好这一建模思想,有利于提升我们的团队效率。
- 综合考虑团队合作的其他因素 如果我们能捕捉到外界干扰后团队合作的反应和特点, 可能会建立一个更全面的团队绩效模型。此外,为了增强绩效指标的测量准确性,需要更多关于成功团队特征的信息(例如,如果进球信息更多,我们可以识别更多关于成功路径的特征,然后让人们效仿)。
6. 对于模型优劣的分析
6.1 模型的优势
- 模型创新地设计了滑动窗口模型
通过滑动窗口模型,足球队可以分析他们在每个时间段的表现,然后根据微观数据设计宏观层面的策略。
- 模型具有较好的鲁棒性和可迁移能力
在建立模型的过程中,采取了灵活的参数,因而模型还可以捕捉足球比赛之外的不同领域的数字特征。
- 具有出色的可视化图形。
6.2 模型的不足
- 算法的时间复杂度大
由于图在每个时间点都部分重构,因此当数据量巨大时,应该谨慎使用模型。
- 在滑动窗口的处理过程中有轻微失真
由于数据集是根据时间点给出,在添加和丢弃传球事件时窗口大小会发生轻微的变化失真。
7. 引用
[1] Duch J, Waitzman J S, Amaral L A N. Quantifying the performance
of individual players in a team activity[J]. PloS one, 2010, 5(6). [2]
GÜRSAKAL N, YILMAZ F M, ÇOBANOĞLU H O, et al. Network motifs in
football[J]. Turkish Journal of Sport and Exercise, 2018, 20(3):
263-272. [3] Buldu, Javier & Busquets, J. & Echegoyen, Ignacio
& Seirul.lo, F.. (2019). Defining a historic football team: Using
Network Science to analyze Guardiola’s F.C. Barcelona. Scientific
Reports. 9. 10.1038/s41598-019-49969-2. [4] Cintia P , Rinzivillo S ,
Pappalardo L . A network-based approach to evaluate the performance of
football teams[C]// Machine Learning and Data Mining for Sports
Analytics workshop (MLSA’15), ECML/PKDD conference 2015. 2015. [5] Lloyd
Smith, Bret Lipscomb, and Adam Simkins. 2007. Data mining in sports:
predicting Cy Young award winners. J. Comput. Sci. Coll. 22, 4 (April
2007), 115–121. [6] Clemente, F. M., Couceiro, M. S., Martins, F. M. L.,
& Mendes, R. S. (2015). Using Network Metrics in Soccer: A
Macro-Analysis. Journal of Human Kinetics, 45(1), 123–134.
修改记录
- 2022-09-08,邱祺智,黄博,方从达