超越感官,沉浸赛场——大型体育赛事云上实战精选-第三章 2022北京冬奥会:百年奥运的黑科技-百年奥运的瞬即美学:凌空之美,分秒凝结—AI编辑部“云智剪”(中)

简介: 超越感官,沉浸赛场——大型体育赛事云上实战精选-第三章 2022北京冬奥会:百年奥运的黑科技-百年奥运的瞬即美学:凌空之美,分秒凝结—AI编辑部“云智剪”

 

2. 科技冬奥的新内容生产力

 

AI与机器学习在体育媒体视频生产领域的应用是产业的大势所趋,随着数字化媒体的高速演进以及受众媒体内容消费习惯的持续更迭,碎片化的短视频内容已经成为各内容消费领域的主流,体育媒体内容领域也不例外。

 

此次冬奥会更是以科技冬奥为主旨,AI在其中的作用至关重要,基于AI编辑部,其云上智能生产能力“AI云智剪”在赛事内容生产中发挥了巨大价值,已俨然成为科技冬奥新内容的生产力。

 

以比赛本身为核心,AI云智剪通过对赛事内容的精彩信息进行定义、提取,从比赛视频、解说词音频、人物场记等各个维度进行识别与分析,并利用多模态融合技术,从实现复杂场景下的特色集锦效果。AI云智剪可以对体育赛事视频进行高效的AI内容分析,可以实时生成多种类型的集锦内容,除了精彩动作镜头、运动员集锦等单赛事中的重要片段以外,还支持国将风采、凌空之美、小将出征等多种复杂主题类型的集锦视频生产,实现视频内容解析、多类型视频素材生产、跨视频的复杂主题视频生成的多层级短视频生产能力覆盖。

 

AI云智剪依靠阿里云视频云强大的流媒体处理能力,可以保证每场比赛的精彩集锦,在3-5分钟内生成,再由平台快速发布出去,极大提升了媒体抢占先机的能力和大众尽享冬奥赛事的体感。

 

image.png

AI云智剪流程图

 

如上图所示,AI云智剪的智能生产过程,主要包含两个步骤:

 

AI模型要对赛事视频进行理解,基于在AI领域的长期积累,AI云智剪可以对多种体育赛事进行细粒度行为、赛场事件、人文事件、镜头类型的深度理解,同时对视频片段进行美学评价、动作精彩度评价、多样性评价,这等同于整个系统的眼睛和大脑,只有看得多、看得细、想得全、想得快,才可以在激烈的冬奥赛场上,为观众们尽快呈现精美绝伦的内容。

 

基于AI模型输出的各类型片段和多指标评价,素材生产模块会基于符合权重进行素材选取,生产大量精选素材,同时也输出多种主题集锦素材。

 

同时,为了响应绿色冬奥的主题,AI云智剪首次采用了单视频理解模型,对多赛事、多来源、多种类的视频进行内容解析、多类型视频素材生产、跨视频的复杂主题视频生成的多层级短视频生产

 

该视频理解模型有三点突出的内容价值:

 

可以对横跨自由式滑雪、花样滑冰、单板滑雪、冰球、速度滑冰、短道速滑等多个赛事中的众多细粒度动作进行识别,捕捉精彩瞬间

 

可以对赛事视频中的非竞技动作进行识别,感知观众的欢呼、选手的情绪、颁奖夺金等关键时刻

 

可以对镜头类型进行区分,进行多类型素材的智能化组合。

 

将完成如此多重复杂的任务重担放在一个模型里,这也对AI云智剪的AI模型泛化能力带来巨大的挑战。

 

image.png

点击这里查看视频:永不放弃!冬奥健将们跌倒后爬起的坚韧

 

image.png

点击这里查看视频:人均“小陀螺”花滑女将踏刃旋转

 

3. 冬奥云上新内容背后的新算法

 

通过AI云智剪呈现新内容,冬奥的云上智能生产运用了全新的智能算法技术。从本质逻辑上,AI云智剪是基于智能算法模型,对视频赛事进行解构、解析、评分,最终再基于多样性策略,以及AI模型输出的多样性评分进行智能化的视频素材生成。

 

正是依托前沿技术,AI模型可以在较少的计算资源需求下,实现多赛事、多来源、多种类的视频进行内容解析、集锦素材生产。

 

协同阿里云视频云的技术输出,阿里巴巴达摩院的算法工程师采用了阿里巴巴最新研发的预训练模型技术LOOK(该技术已经被人工智能领域顶级会议ICLR 2022录用)。相比于常见的训练方式要求所有的同类别样本特征接近于一个中心特征,LOOK可以在模型训练过程中仅要求接近的同类样本更加接近,保留更多的特征自由度。

 

可以认为,这是从一个“求同去异”到“求同存异”的过程改进,正因为在训练过程保留了更多的有效信息,也使得模型特征的表示能力更加通用,最终基于这一个通用表征的基础模型,构建了多个轻量级的多分枝任务模型,去完成多项任务。

 

因为共享了同一个基础表示模型,在计算消耗上多个任务分枝比单个任务分支增加的额外计算负担几乎可以忽略不计,但却可以和直接使用多个模型达到同样的AI能力。

 

正是基于这一技术,AI云智剪更快更高更强地支撑起冬奥会的短视频生产任务。

 

image.png

预训练模型技术LOOK示意图

 

在使用预训练模型技术以外,由于此次冬奥会视频数据是模型“从未见过”的数据,为了保证模型的鲁棒性和计算结果的稳定性,阿里巴巴最新研发的开集识别技术NGC(录取为ICCV 2021 Oral)也被引入其中。AI模型会同时利用模型预测的置信度和特征的几何结构,来共同决定最终结果,这也使得AI云智剪虽然是第一次在冬奥会上登场,但也是相当的“”。

 

image.png

开集识别算法NGC示意图

 

此外,阿里巴巴达摩院在视频理解领域积累了大量技术,包括基础模型表征,时序特征建模、自监督表示等,通过阿里云视频云AI云智剪的能力输出,均在这次冬奥会中展露头脚,也被开源在EssentialMC2技术框架中,以此致力于推动视频内容理解领域社区的技术发展。

相关文章
|
17天前
|
机器学习/深度学习 数据采集 人工智能
PyTorch学习实战:AI从数学基础到模型优化全流程精解
本文系统讲解人工智能、机器学习与深度学习的层级关系,涵盖PyTorch环境配置、张量操作、数据预处理、神经网络基础及模型训练全流程,结合数学原理与代码实践,深入浅出地介绍激活函数、反向传播等核心概念,助力快速入门深度学习。
69 1
|
13天前
|
人工智能 自然语言处理 API
快速集成GPT-4o:下一代多模态AI实战指南
快速集成GPT-4o:下一代多模态AI实战指南
203 101
|
17天前
|
人工智能 JSON 测试技术
AI智能体开发实战:从提示工程转向上下文工程的完整指南
曾被热捧的提示工程正逐渐退潮,本文揭示其局限性,并提出“上下文工程”新范式:通过结构化提示、精准上下文管理、工具调用与统一状态,构建可扩展、可恢复、生产级的智能体工作流,推动AI系统迈向工程化与可控化。
183 9
AI智能体开发实战:从提示工程转向上下文工程的完整指南
|
17天前
|
存储 消息中间件 人工智能
【08】AI辅助编程完整的安卓二次商业实战-修改消息聊天框背景色-触发聊天让程序异常终止bug牵涉更多聊天消息发送优化处理-优雅草卓伊凡
【08】AI辅助编程完整的安卓二次商业实战-修改消息聊天框背景色-触发聊天让程序异常终止bug牵涉更多聊天消息发送优化处理-优雅草卓伊凡
90 10
【08】AI辅助编程完整的安卓二次商业实战-修改消息聊天框背景色-触发聊天让程序异常终止bug牵涉更多聊天消息发送优化处理-优雅草卓伊凡
|
17天前
|
XML 存储 Java
【06】AI辅助编程完整的安卓二次商业实战-背景布局变更增加背景-二开发现页面跳转逻辑-替换剩余图标-优雅草卓伊凡
【06】AI辅助编程完整的安卓二次商业实战-背景布局变更增加背景-二开发现页面跳转逻辑-替换剩余图标-优雅草卓伊凡
45 3
【06】AI辅助编程完整的安卓二次商业实战-背景布局变更增加背景-二开发现页面跳转逻辑-替换剩余图标-优雅草卓伊凡
|
6天前
|
设计模式 人工智能 API
AI智能体开发实战:17种核心架构模式详解与Python代码实现
本文系统解析17种智能体架构设计模式,涵盖多智能体协作、思维树、反思优化与工具调用等核心范式,结合LangChain与LangGraph实现代码工作流,并通过真实案例验证效果,助力构建高效AI系统。
85 7
|
8天前
|
人工智能 搜索推荐 开发工具
私域知识工程实战:如何让AI一次性写出高质量代码?
AI编程的瓶颈不在于模型不够聪明,而在于信息不对称。通过简单、快速构建私域知识工程体系 ,让AI从 "临时工" 变成真正懂业务的 "老司机" 。
|
17天前
|
人工智能 Serverless API
函数计算的云上计费演进:从请求驱动到价值驱动,助力企业走向 AI 时代
函数计算计费方式历经三阶段演进:从按请求计费,到按活跃时长毫秒级计费,再到按实际资源消耗分层计费。背后是资源调度、安全隔离与开发体验的持续优化。尤其在AI时代,低负载减免、会话亲和等技术让计费更贴近真实价值,推动Serverless向“按需使用、按量付费”终极目标迈进。
|
14天前
|
人工智能 自然语言处理 算法
现代AI工具深度解析:从GPT到多模态的技术革命与实战应用
蒋星熠Jaxonic,AI技术探索者,深耕代码生成、多模态AI与提示词工程。分享AI工具架构、实战应用与优化策略,助力开发者提升效率,共赴智能编程新纪元。
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC技术深度解析:生成式AI的革命性突破与产业应用实战
蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。

热门文章

最新文章