在北京冬奥会上有一项黑科技引发了广泛的关注,就是英特尔® 3DAT三维运动员追踪技术(3D Athlete Tracking,3DAT)。中国速度滑冰队夺取北京冬奥会速度滑冰男子500米比赛金牌并刷新了该项目奥运纪录,以及北京冬奥会开幕上《致敬人民》和《雪花》两个节目中令人赞叹的演员与现场大屏互动观赏效果,背后都有3DAT技术参与实现。
将人工智能等数字技术应用于竞技体育,是数字体育的一大发展方向。特别是用人工智能技术捕捉和重建冠军的运动姿态和生物力学模型等的冠军模型,对于推动人类探索和突破竞技体育极限,以及将冠军模型普惠给更多运动员甚至提升大众运动水平等方向都极具价值。而《致敬人民》和《雪花》两个节目效果,更彰显了人工智能与运动及艺术结合的潜力。
3DAT技术在北京冬奥会的开幕式和部分训练中成功应用后,已经有很多体育运动甚至非体育运动的合作伙伴或用户,也在考虑这项技术在其业务场景中的应用价值。在3月25日的“AI黑科技走出赛场普惠大众”英特尔IN Club硬客沙龙上,英特尔技术团队详细介绍了3DAT技术及其发展历程,并期望推动这项技术走进大众运动。
结缘挪威高山滑雪
3DAT技术,简单理解就是对运动员的运动过程进行连续拍照,再运用人工智能技术对照片进行分析,提取出运动员在高速运动下的运动姿态数据,结合生物力学模型进行分析,用于运动员的日常训练以及大赛后的分析总结,对于冠军运动员的夺冠赛分析则可形成相应的冠军模型。对于3DAT技术来说,找到关键的运动姿态数据,是其核心挑战。
将深度神经网络模型用于图片及视频分析,已经取得了突破性进展。但要将这项技术用于运动员的运动姿态分析,就必须结合不同运动的类型及其生物力学模型等专业知识。璇米科技CEO、前英特尔资深技术专家李洪刚在“AI黑科技走出赛场普惠大众”英特尔IN Club硬客沙龙上介绍,早在2018平昌冬奥会刚结束的9月,英特尔技术团队就带着3DAT技术原型访问了挪威奥委会及下属机构Oplimpiantoppen体育科研所和高山滑雪协会等。
英特尔技术团队在挪威的利勒·哈默尔高山滑雪协会训练中心遇到了主攻高山滑雪生理学科的罗伯特·里德博士,当时英特尔技术团队有两大任务:一是了解如何将3DAT技术应用到日常训练中;二是了解3DAT技术是否能够帮助运动员提升训练效果。
(英特尔技术团队用四部相机完成了高山滑雪小回转项目运动员动作捕捉)
高山滑雪对于3DAT技术从原型到实际应用来说是一个很高的起点。高山滑雪主攻弯道技术,也就是在过弯道时候使用滑雪板的韧——将韧切入雪中实现高速过弯道。英特尔技术团队当时与高山滑雪的小回转项目合作,在40米左右的滑道上安装了四部相机用于捕捉滑雪运动员过旗门的动作。除了小回转项目,英特尔技术团队还了解了越野滑雪、体能训练等相关运动及训练的专业知识。当时Oplimpiantoppen体育科研所已经在运动员体能训练等环节大量使用摄像头捕捉运动员姿态、频率、频度等,这些都给了英特尔技术团队极大的启发。
3DAT技术详解
近年来,运动员们逐渐用上了动作追踪技术来辅助训练。采集数据、分析量化的方法能帮助提高每一次训练的效率。
具体来看动作追踪技术的原理,分为两个阶段。
在阶段一,AI根据摄像机拍下的视频,提取运动员的关键骨骼点信息、身体关键部位的姿态、运动轨迹和位置信息等,并进行三维重建。以速度滑冰项目的起跑阶段为例,3DAT技术在运动员全身定义了23个动作捕捉点,可以生成运动员的步频、蹬冰(Push off)时间、悬空(Air time)和地面(Ground time)时间、膝关节角速度、起跑角速度等一组参数集,再用人工智能进行运动员三维姿态重建,对照片中的人形进行检测扫描并生成2D骨骼,对每套2D骨骼通过多个相机进行跟踪,结合场地平面等先验信息,生成3D姿态数据,最后进一步生成生物力学数据。
在阶段二,运用生物动力学(Biomechanics)算法对数据做分析,计算出运动员和教练员关注的参数。通过人工智能技术的追踪,呈现出运动员关节的空间运动轨迹,例如速度滑冰运动员膝关节的运动轨迹,为教练提供了珍贵的,甚至是人眼无法获得的运动数据。
英特尔公司首席工程师余志洪在沙龙上介绍,英特尔® 3DAT三维运动员追踪技术之所以被称为黑科技,是因为它不同于此前的动作捕捉技术,3DAT不需要专用摄像机如高分辨率红外摄像机等,也不需要被捕捉者穿戴任何传感器,只需用普通单反甚至手机拍摄视频,就能通过精心设计和优化的AI算法,导出三维运动姿态并进行精准的数据分析。3DAT还可以低成本解决比赛中大范围3D姿态重建的难题,像花样滑冰1800平方米这样大型的场地,只用2-4个摄像头就能采集到运动员在此范围内的所有动作。
英特尔® 3DAT三维运动员追踪技术不仅支持1080P、4K等画质,还能以高于每秒100帧的速度解码。测量误差可以压低至5毫米级别,角度误差也控制在7-8度左右。另一方面,3DAT还可以把以上捕捉到的效果,实时展现给教练员,大幅提升了指导的效率;并且可采集记录下每一位运动员的数据,形成单独的数据库,方便教练员回看和调取记录,以此来分析制定训练计划。
为了保证精度和实时性,3DAT背后有一整套软件算法和硬件加速的支持。
首先,AI算法是来自英特尔,且运行在CPU上。其中使用了英特尔® OpenVINO™ 视觉工具套件,提供深度学习推理套件(DLDT),从而将各种训练好的模型进行线上部署。3DAT不只可以辅助速度滑冰一个项目训练,像花样滑冰、越野滑雪等项目,只要有训练好的模型,就能通过OpenVINO完成部署。据介绍,采集5万张左右图像就能训练好适配一项运动的模型。也就是说,只要有了数据,就可以根据需求调整算法。
3DAT使用第三代英特尔® 至强® 可扩展处理器,它可用于云计算、高性能计算、数据分析和AI等应用场景,拥有8-40个内核,支持8通道DDR4,64条PCI EXPRESS 4.0通道,以及专为AI应用的加速——集成了英特尔® 深度学习加速技术,不仅可以使用CPU加速AI,而且在优化到位的情况下还可以媲美专用AI加速芯片的效果。像开幕式上“和平鸽雪花”节目中超过600人实时动捕,只用了4颗第三代英特尔® 至强® 可扩展处理器,时延还远低于预定的目标,就是采用了OpenVINO+第三代英特尔® 至强® 可扩展处理器对INT8模型的加速能力。
存储方面使用了英特尔® 傲腾™ 技术,可以提供持续型内存、大型内存池、快速缓存和快速存储,以此来保证数据的低时延处理。同时,3DAT还应用英特尔® Scalable Video Technology,可对相机拍下的画面进行高效编码,进一步降低视频数据的压缩存储和上云的带宽需求。
从竞技体育到大众运动
在北京冬奥会的开幕式和备战训练中,3DAT技术展现出了巨大的价值和潜力。未来,英特尔希望3DAT技术走向更广泛的场景,即在所有需要动作追踪的应用场景中进行推广,实现“无门槛化应用”。
3DAT从竞争体育入手,打磨一整套具备平民化应用前景的AI技术体系。从2021年冬季开始,中国速度滑冰队便已经在日常训练中用上了这套视觉动捕系统。速度滑冰作为一项纯速度较量的比赛项目,把动作优化到极致、不断逼近人体极限是运动员取胜的关键所在。
利用视频动捕技术,AI可以实现速度滑冰运动员三维姿态重建,对起跑、加速等动作进行精准量化评估,测量误差可以控制在5毫米以下。通过3DAT将多次训练数据积累起来,纵向能总结某一个运动员自身的习惯和特点,横向能比对不同运动员间的长处与短板。教练员可以在3DAT技术的支持下整理并提出科学训练计划和专业策略,有效提升训练效率。
EXOS是当今世界上最具影响力的运动训练服务机构之一,该机构负责运动能力创新(Performance Innovation)高级副总裁Craig Friedman认为3DAT技术为运动员带来了巨大的进步,就好像从50年代黑白电视到后来彩电的跃变。从最开始的人眼观察,发展到使用视频回看的方式进行技术分析,但始终没有详细的数据可供进一步的分析,而3DAT技术则提供了大量的运动数据供教练进行定量分析。
未来,3DAT计算还可以迁移至云上进行,对设备的要求还能进一步降低,使用者基本使用自备视频拍摄的设备,如手机即可。余志洪介绍,英特尔期望用3DAT技术赋能体育产业,尽可能降低体育产业应用AI的门槛,赋能更多的生物力学专家使用3DAT方案。目前,英特尔已经与亚马逊云科技合作,在云上通过Cloud SDK和API等形式供合作伙伴、开发者和生物力学专家使用。通过亚马逊云科技上一整套的云解决方案,生物力学专家可以直接进行数据分析,ISV与开发者也可以进行二次开发。
余志洪强调,3DAT虽然从专业运动员开始,但它有着广泛赋能大众运动的前景。例如,疫情期间很多人没办法到线下俱乐部进行健身,一个解决方案就是教练通过网上连线的方式检查学员动作是否准确。而3DAT的低门槛 ,则刚好可以在大众的健身环节中发挥作用,帮助学员和教练进行动作的校正,甚至有可能因此开发出一套人工智能自动校正动作系统。此外,在老人或运动康复方面,也可以运用3DAT精确校正某个环节的复原是否到位等等。除了体育运动外,对动捕应用需求旺盛的游戏、虚拟现实、线上购物、数字艺术创作等领域,也有望受益于3DAT技术。
整体来说:3DAT技术是数字体育的一大进展,是将AI应用于体育运动的普惠型技术方案。通过近几年在竞技体育等“象牙塔”的应用实践,证明了3DAT技术的可行性、可靠性以及为运动员带来的真正价值。未来,随着3DAT技术进一步的云端化,有望普惠更为广泛的非专业运动人群以及普通大众,让科学运动和科学健身走进日常训练与生活,成为体育及大众运动健身数字化转型的有力工具。