运用深度学习预测NBA中的伤病情况
中国体育用品业联合会时间:2022-04-29点击:
导 语
由于样本量小、数据不平衡和统计方法不足等多种因素,预测运动员受伤风险一直是运动医学领域届的难题,迄今为止进展甚微。在本研究中,我们通过使用公开可用的数据源收集 NBA 球员受伤的纵向数据来解决小样本问题,并开发最先进的深度学习模型 METIC,以根据过去的受伤情况、比赛活动和球员统计数据预测未来的受伤情况。我们发现 METIC 的性能明显优于其他传统机器学习方法。METIC 使用特征学习来创建交互特征,这些特征相互结合变得有意义。体育从业者可以使用 METIC 来改善运动员管理并减少受伤发生率,从而可能因减少运动员受伤而为运动队节省数百万美元的支出。
作者: lexander Cohan, Jake Schuster, and Jose Fernandez
编译:姜本桥
如欲阅读原文,全文见于:
Journal of Sports Analytics 7 (2021) 277–289,DOI 10.3233/JSA-200529
研究简介
尽管在运动医学以及分析方面进行了大量投资,但运动队每年会因运动员受伤而损失数百万美元的收入。对于运动伤病减少的相关支持人员已经存在了数十年,但是并没有取得足够的进展,目前的运动监测和管理不能有意义地预测受伤风险。机器学习中的深度学习的最新进展使得对这一关键任务有了新的方法——以一种为决策者提供可操作的见解的方式预测潜在的运动伤病。这些信息可以被体育组织用于各种领域,如训练优化、负荷管理和未来的球员预测。
传统的运动员负荷监测方法的有效性是有限的,因为它只能说明影响运动员表现的几块拼图,而且预测分析技术不佳,无法预测受伤风险。推进能够为运动员管理提供信息的更有用的方法是一个值得追求的目标。在运动医学和表现领域,使用统计计算来确定受伤风险往往受到种种阻碍,不同的工作人员部门没有充分沟通以利用数据,或者使用的数据范围有限,未能考虑到可能影响受伤风险的广泛因素。所涉及的数据科学实践往往由于过于简单的方法和有缺陷的指标而达不到必要的标准,与此相反,在数据科学的最新进展允许的情况下,深度学习是一种有意义的尝试。
在本文中,我们提出了一个模型,尽管我们的数据缺少确切的发生时间和受伤类型等细节,但该模型的性能优于其他可用的方法,这有可能显著提高模型的准确性。我们的方法展示了深度学习模式在预测受伤风险方面的潜力。
研究方法
我们使用的伤病数据包括2010-2020年间NBA报告的每一个伤病。该数据集包含了11000个伤病信息,但伤病报告时间的准确性和彻底性不能保证,因为有时球队会掩盖球员伤病,以保持竞争优势。我们根据官方联盟报告中使用的关键词,将伤病被分为八种常见的类型:背部、接触、挫伤、核心、足部、韧带、肌肉和上半身。
虽然我们的数据显示,身高可能会影响背部和韧带受伤的风险,但这一点以前并没有得到支持。我们发现,高的比赛时间负荷,如前五场比赛超过100分钟,影响了所有伤病的发生率,特别是肌肉和挫伤型伤病。总的来说,以前的损伤是未来损伤的一个有意义的指标,这在多个运动项目的不同损伤类型中都得到了证明。
我们提出了一种新的深度学习方法来评估伤病分类METIC:用于伤病分类的多个双向编码器变形器。METIC使用多个转化器编码器来处理过去的伤病和以前的比赛有关的数据序列,包含320万个可学习参数。我们将过去的比赛分析限制在之前的5场比赛,同时考虑所有过去的伤病。
研究结果
我们的结果证实了以前的伤病是预测未来任何类型伤病的重要因素。在我们的数据集中,年长的运动员发生了更多的伤病,这一信息可以与其他因素相结合,以更好地管理运动员进一步的职业生涯。有趣的是,我们发现挫伤的数量对许多其他伤病类型,如上半身和肌肉伤病很重要。我们推测,带着小伤的运动员可能容易招致更严重的伤病,无论是因为累积的疲劳、改变的运动模式,还是其他的因素。
通常来说与年龄、比赛地点、身高和体重有关的风险因素相对较低,但METIC发现这些因素在决定所有伤病类型的伤病风险方面非常重要。这些特征本身可能对伤病风险分类没有什么启示,然而,它们在METIC的特征学习过程中非常重要。在这个学习过程中,学习到的特征建立在这些数据点的基础上,对伤病进行分类。METIC特征重要性和相对风险因素之间的差异突出了运动员数据点和伤病之间的非线性复杂关系。
相关讨论和结论
在本文中,我们提出了一个新的深度学习模型METIC,用于预测过去受伤和比赛活动的受伤分类。这个模型在伤病预测方面达到了一个新的水平,并对球员活动和历史之间的非线性关系提供了有用的见解。最重要的是,它利用了信息的被动聚合,而不需要手动提取与运动员监测有关的日常数据。虽然专有的生物计量数据可以提高模型的通用性,但利用现成的数据进行有效的预测,对体育组织具有很大的价值。将不同的数据类型结合起来进行分析,为运动员管理过程提供信息,可以提供竞争优势。
METIC在伤病风险分类方面的整体表现说明了深度学习在体育科学中的应用的效用和潜力。识别伤病风险的非线性和多因素分类器对运动员和体育组织有很大用处。复杂模型的一个重要用途是,那些单一因素本身并不重要,但与其他因素结合在一起就有意义了。METIC能够利用表征学习捕捉多个运动员数据点之间复杂的非线性关系,从而对运动损伤进行有力的归纳。
运动员和体育组织可以利用METIC模型和他们自己的数据对损伤风险进行分层,并为运动员管理决策提供信息,以减少损伤发生率并最终提高成绩。METIC提出了一种结合不同数据源的新方法,它在各种运动监测领域中学习了多因素的重要性,能够智能地利用其众多数据源的团队可以获得显著的竞争优势。
来源:THU体育科技评论
图文来源网络 如有侵权 请联系删除
本行业信息均来源于网络,不代表本会观点,内容仅供参。