学位专题

目录>
<

基于时空图卷积的乒乓球基础技术动作识别

孙于成
安庆师范大学
引用
乒乓球运动在中国有着特殊地位,乒乓球运动员为祖国在国际赛场上取得无数荣誉。这不仅与运动员本身的天赋和努力有关,也和背后教练团队的付出息息相关,教练团队依靠“乒乓球技战术分析”继续针对性训练。传统的方法依靠人工标记击球动作,耗时耗力。近些年,随着深度学习的火热,其被广泛应用于日常动作识别这一领域。通过深度学习的方法实现击球动作的分类可以提高训练效率,但与日常动作不同,乒乓球运动存在附加动作和遮挡问题,同时目前也缺乏针对乒乓球击球动作分类的数据集。  针对上述问题,本文首先建立了基于视频的乒乓球基础技术动作数据集。该数据集涵盖乒乓球竞技中的七种基础技术动作,分别是:正手攻球、反手攻球、正手劈长、反手劈长、正手摆短、反手摆短和推挡。  结合现有研究,本文首先使用人体姿态预测的相关方法对乒乓球基础技术动作的视频数据进行预处理,将视频数据转换为骨骼数据。对于这些骨骼数据,本文在第三章提出了一种时空图卷积框架下的基于局部关节点的乒乓球基础技术动作识别方法。具体来说,修改人体姿态预测的训练网络,使其输出局部9个关节点的三维坐标。将这9个关节点的三维坐标信息输入时空图卷积网络,训练网络参数以学习关节点的空间特征与时间特征。最后使用训练后的参数测试并输出动作分类的准确率。该方法在自建乒乓球基础技术动作数据集上可以达到93.76%的识别率,而在公开数据集NTURGB+D上也可以达到79.41%的识别率。  同时,直接使用视频数据训练也可以较好的学习视频的轮廓信息和色彩信息。因此本文在第四章提出了一种结合视频数据和骨骼数据的双流融合方法。该方法通过手动裁剪视频数据,将裁剪后的视频图像逐帧输入卷积神经网络,通过添加注意力机制,使网络自发关注运动员手部动作,将添加注意力机制的数据输入卷积长短时记忆网络训练并测试。该方法在自建的乒乓球基础技术动作数据集上可以达到88.89%的识别率。同时该方法的结果与第三章方法的结果的均值作为最终结果输出,可以实现多种信息融合。最终将自建的乒乓球基础技术动作数据集的分类识别率提高到94.97%。

动作识别;乒乓球运动;视频图像;骨骼数据;注意力机制;信息融合

安庆师范大学

硕士

统计信息技术

苏本跃

2020

中文

TP391.41

2022-01-10(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅