人工智能要想理解真实世界发生的事,读取视频中的信息是非常重要的一步。阿里云视频识别技术能够初步辨识出篮球视频中运动员的动作类型。
业务痛点及需求
对竞技运动视频的识别与比较是一种基于视频运动目标分割与提取、运动目标视频合成与比较运动目标分析技术,通过实际训练体态或动作与标准体态或动作的比较,达到科学的运动分析的目的。目前,视频图像处理还不能在体育科学化训练中得到广泛的应用,主要是受到图像处理技术的发展水平的应用有很大关系。
系统架构
采用双路CNN的方法。其实就是两个独立的神经网络了,最后再把两个模型的结果平均一下。上面一个就是普通的单帧的CNN,而且文章当中提到了,这个CNN是在ImageNet的数据上pre-train,然后在视频数据上对最后一层进行调参。下面的一个CNN网络,就是把连续几帧的光流叠起来作为CNN的输入。 另外,它利用multi-task learning来克服数据量不足的问题。 其实就是CNN的最后一层连到多个softmax的层上,对应不同的数据集,这样就可以在多个数据集上进行multi-task learning。网络架构图所示。
优势
我们把视频内容分割成为小的片段,然后利用大量的视频内容对模型进行训练,从而能够识别诸如上篮、得分、扣篮、挡拆、运球、传球等篮球运动场景。下图显示了该系统对得分和扣篮的视频识别结果。
利用该系统,以往需要人工记录的篮球比赛文字直播都可以用计算机来代替,结合对运动场地、运动员人脸识别、运动员行为轨迹分析等技术,还可以做更为精准的记录。这为比赛资料的备份,运动员技术统计等提供了非常有效的帮助。特别是用在一些低级别比赛的记录中更有成本的优势。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
阿里云视频识别技术针对竞技运动视频分析的需求,提供了以下专业且结构化的解决方案:
动作行为识别: 利用深度学习模型,能够从篮球视频中辨识出运动员的具体动作类型,如上篮、得分、扣篮、挡拆、运球、传球等。这不仅提升了识别的准确性,还极大提高了处理速度和自动化程度。
多任务学习与双路CNN架构:系统采用创新的双路CNN方法,结合预训练模型与光流信息输入,有效克服了数据量不足的问题,并通过多任务学习在多个数据集上优化模型性能,确保了对复杂运动场景的精准理解。
内容分割与片段训练:将视频内容分割为小片段进行模型训练,利用大规模视频资料增强模型的学习能力,使其能更准确地识别各类篮球运动场景。
双路神经网络设计:结合单帧图像分析的CNN与基于连续帧光流信息的CNN,两者的输出结果综合考虑,提高了动作识别的鲁棒性和精确度。
Multi-task Learning策略:通过一个模型服务于多种任务(如不同运动动作分类),共享低层特征的同时,针对不同任务优化高层表示,增强了模型的泛化能力和数据利用率。
科学化训练辅助:通过与标准动作的比较,该系统能辅助体育训练,提供科学化的运动分析反馈,促进技能提升。
比赛记录自动化:替代人工记录,实现篮球比赛的文字直播自动化,结合人脸识别、行为轨迹分析等技术,提高记录的精度和效率。
数据分析与统计:自动记录的比赛数据可直接用于运动员技术统计,为教练团队提供详实的数据支持,便于战术分析和调整。
成本效益显著:尤其适用于低级别比赛的记录工作,以较低成本实现高质量的比赛资料备份和数据分析,有利于球队管理和赛事运营。
综上所述,阿里云视频识别技术通过先进的算法架构和深度学习方法,有效解决了竞技运动视频分析中的识别难题,为体育训练、比赛记录及数据分析带来了高效、准确的智能化解决方案。