AI概述:阿里文娱智能算法的新应用

简介: 阿里巴巴文娱-智能算法的新应用方向

作者| 阿里文娱资深算法专家 胡尧

**一、文娱消费新体验-Free Viewpoint Video
**

001.jpg
面向文娱消费新体验,文娱算法团队基于整体的视频生产、播放、交互式体验等环节做了非常多的技术探索,在视频子弹时间的基础上进一步延展,延伸成更加经济通用的Free Viewpoint Video技术,构建完善的现场-云-边-端的技术链路。

今年优酷与CBA达成全方位的合作,在新赛季首次落地互动FVV体验,变革传统体育赛事的观看体验。我们还主导建设FVV视频技术国家标准,同时承担了国家“科技冬奥”“冰雪项目交互式多维度观赛体验技术与系统”项目,让更多普通用户享受到新一代观看体验。

二、视频消费商业化新模式-创意广告

在视频消费商业化新模式上,重点在创意广告领域,打造动效酷炫、更原生、可互动的广告形态,通过规模化实现中长尾内容的变现。

具体是构建了综合的三维环境感知和理解算法,在多场景多模态的视频内容理解、云端结合的CG 渲染引擎等领域都有深度探索,并且构建云端结合的c c级渲染引擎,实现AI两大平台(视频打点平台、视频特效生产平台)、一个中心的战略(创意广告制作中心)。

**
三、视频创作新平台-基础素材自动化生产与检索**
002.jpg

在视频理解领域的另一个重要应用,就是搭建了视频创作新平台。

首先,我们实现了基础素材的自动化生产与搜索,将传统的静态人物动作和场景实现升级到shot 级别,支持动态素材的检测与识别。

同时,实现精细化抠图,包括对动态人物和物体场景的提取,使这些素材可以被创作者更快速的应用到新的创作环境中。通过交互式的精细化分割算法,动态地将经典视频中的素材提取出来,实现简易化绿幕的效果。

当大量的素材被生产出来,我们同时提供基于准素材级别的智能化检索系统,用户只需要通过语义的文本或语音输入,就能实现对整个素材库的检索。例如用户搜索“吴倩拥抱”,系统就会呈现出整个《冰糖炖雪梨》中有吴倩拥抱的场景。

**
四、视频创作新平台-封面图自动化生产**

003.png
另外,我们实现了封面图自动化生产。基于主要人物、场景、美学评级、元素多样性等方面生成不同维度的封面图,并提供智能裁剪服务,满足16:9、4:3或者3:4等各种场景需求。同时在某些场景中实现动图的自动化生产,即实现千人千面的内容+素材的统一个性化推荐,助力运营分发的提效。

五、视频创作新平台-模板式视频半自动化生产

鉴于优酷有海量的IP版权内容,我们研发了一系列的剪辑合成技术,自动对视频的故事线、内容模板进行提取,并在此基础上在海量视频中进行智能化的二次创作,实现如节目卡点剪辑、Video Highlight & Summary技术生成的前情提要等产品。同时具备视频的形态转换技术,将横版的视频通过AI算法,识别显著性主体区域并进行美学评判,实现竖版视频的自动化生产。

这些技术能够有效的为商业化提供更多素材,同时为B端提供更多能力。
004.jpg

在这个基础上,我们才能实现基于元素级的视频深度理解技术,我们将传统的基于用户行为的内容分发体系和基于视频内容理解的视频内容分发体系进行了有效结合,实现了群体智慧和计算机视觉在美学和AI上的融合,实现了从整个封面图内容的原数据分析,到整个用户行为偏好的判断,实现千人千面的内容加素材的个性化推荐,有效提升整个业务场的分发效率。

相关文章
|
人工智能 自然语言处理 Devops
云效 AI 智能代码评审体验指南
云效AI智能代码评审正式上线!在合并请求时自动分析代码,精准识别问题,提升交付效率与质量。支持自定义规则、多语言评审,助力研发效能升级。立即体验AI驱动的代码评审革新,让AI成为你的代码质量伙伴!
294 7
|
2月前
|
人工智能 自然语言处理 算法
【2025云栖大会】AI 搜索智能探索:揭秘如何让搜索“有大脑”
2025云栖大会上,阿里云高级技术专家徐光伟在云栖大会揭秘 Agentic Search 技术,涵盖低维向量模型、多模态检索、NL2SQL及DeepSearch/Research智能体系统。未来,“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”
364 9
|
2月前
|
人工智能 运维 关系型数据库
云栖大会|AI时代的数据库变革升级与实践:Data+AI驱动企业智能新范式
2025云栖大会“AI时代的数据库变革”专场,阿里云瑶池联合B站、小鹏、NVIDIA等分享Data+AI融合实践,发布PolarDB湖库一体化、ApsaraDB Agent等创新成果,全面展现数据库在多模态、智能体、具身智能等场景的技术演进与落地。
|
2月前
|
机器学习/深度学习 人工智能 算法
用于实验室智能识别的目标检测数据集(2500张图片已划分、已标注) | AI训练适用于目标检测任务
本数据集包含2500张已标注实验室设备图片,涵盖空调、灭火器、显示器等10类常见设备,适用于YOLO等目标检测模型训练。数据多样、标注规范,支持智能巡检、设备管理与科研教学,助力AI赋能智慧实验室建设。
用于实验室智能识别的目标检测数据集(2500张图片已划分、已标注) | AI训练适用于目标检测任务
|
2月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
419 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
2月前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。
|
2月前
|
人工智能 编解码 搜索推荐
AI智能换背景,助力电商图片营销升级
电商产品图换背景是提升销量与品牌形象的关键。传统抠图耗时费力,AI技术则实现一键智能换背景,高效精准。本文详解燕雀光年AI全能设计、Canva、Remove.bg等十大AI工具,涵盖功能特点与选型建议,助力商家快速打造高质量、高吸引力的商品图,提升转化率与品牌价值。(238字)
267 0
|
2月前
|
人工智能 自然语言处理 小程序
拔俗AI审前服务平台:让法律准备更智能、更高效,助力司法公正提速
AI审前服务平台融合大模型与法律知识,智能解析证据、推送类案、评估风险,助力律师高效备诉、当事人理性维权,推动法律服务普惠化、精准化,是智慧司法的重要基石。(238字)