开发者社区 问答 正文

阿里云ET篮球动作视频识别


人工智能要想理解真实世界发生的事,读取视频中的信息是非常重要的一步。阿里云视频识别技术能够初步辨识出篮球视频中运动员的动作类型。

业务痛点及需求


对竞技运动视频的识别与比较是一种基于视频运动目标分割与提取、运动目标视频合成与比较运动目标分析技术,通过实际训练体态或动作与标准体态或动作的比较,达到科学的运动分析的目的。目前,视频图像处理还不能在体育科学化训练中得到广泛的应用,主要是受到图像处理技术的发展水平的应用有很大关系。

系统架构


采用双路CNN的方法。其实就是两个独立的神经网络了,最后再把两个模型的结果平均一下。上面一个就是普通的单帧的CNN,而且文章当中提到了,这个CNN是在ImageNet的数据上pre-train,然后在视频数据上对最后一层进行调参。下面的一个CNN网络,就是把连续几帧的光流叠起来作为CNN的输入。 另外,它利用multi-task learning来克服数据量不足的问题。 其实就是CNN的最后一层连到多个softmax的层上,对应不同的数据集,这样就可以在多个数据集上进行multi-task learning。网络架构图所示。

优势


我们把视频内容分割成为小的片段,然后利用大量的视频内容对模型进行训练,从而能够识别诸如上篮、得分、扣篮、挡拆、运球、传球等篮球运动场景。下图显示了该系统对得分和扣篮的视频识别结果。


利用该系统,以往需要人工记录的篮球比赛文字直播都可以用计算机来代替,结合对运动场地、运动员人脸识别、运动员行为轨迹分析等技术,还可以做更为精准的记录。这为比赛资料的备份,运动员技术统计等提供了非常有效的帮助。特别是用在一些低级别比赛的记录中更有成本的优势。

展开
收起
nicenelly 2017-10-26 11:04:11 1940 分享 版权
阿里云 AI 助理回答

阿里云视频识别技术针对竞技运动视频分析的需求,提供了以下专业且结构化的解决方案:

1. 技术应用与优势

  • 动作行为识别: 利用深度学习模型,能够从篮球视频中辨识出运动员的具体动作类型,如上篮、得分、扣篮、挡拆、运球、传球等。这不仅提升了识别的准确性,还极大提高了处理速度和自动化程度。

  • 多任务学习与双路CNN架构:系统采用创新的双路CNN方法,结合预训练模型与光流信息输入,有效克服了数据量不足的问题,并通过多任务学习在多个数据集上优化模型性能,确保了对复杂运动场景的精准理解。

  • 内容分割与片段训练:将视频内容分割为小片段进行模型训练,利用大规模视频资料增强模型的学习能力,使其能更准确地识别各类篮球运动场景。

2. 系统架构特点

  • 双路神经网络设计:结合单帧图像分析的CNN与基于连续帧光流信息的CNN,两者的输出结果综合考虑,提高了动作识别的鲁棒性和精确度。

  • Multi-task Learning策略:通过一个模型服务于多种任务(如不同运动动作分类),共享低层特征的同时,针对不同任务优化高层表示,增强了模型的泛化能力和数据利用率。

3. 业务痛点解决与应用场景

  • 科学化训练辅助:通过与标准动作的比较,该系统能辅助体育训练,提供科学化的运动分析反馈,促进技能提升。

  • 比赛记录自动化:替代人工记录,实现篮球比赛的文字直播自动化,结合人脸识别、行为轨迹分析等技术,提高记录的精度和效率。

  • 数据分析与统计:自动记录的比赛数据可直接用于运动员技术统计,为教练团队提供详实的数据支持,便于战术分析和调整。

  • 成本效益显著:尤其适用于低级别比赛的记录工作,以较低成本实现高质量的比赛资料备份和数据分析,有利于球队管理和赛事运营。

综上所述,阿里云视频识别技术通过先进的算法架构和深度学习方法,有效解决了竞技运动视频分析中的识别难题,为体育训练、比赛记录及数据分析带来了高效、准确的智能化解决方案。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答