AI概述:阿里文娱智能算法的新应用

简介: 阿里巴巴文娱-智能算法的新应用方向

作者| 阿里文娱资深算法专家 胡尧

**一、文娱消费新体验-Free Viewpoint Video
**

001.jpg
面向文娱消费新体验,文娱算法团队基于整体的视频生产、播放、交互式体验等环节做了非常多的技术探索,在视频子弹时间的基础上进一步延展,延伸成更加经济通用的Free Viewpoint Video技术,构建完善的现场-云-边-端的技术链路。

今年优酷与CBA达成全方位的合作,在新赛季首次落地互动FVV体验,变革传统体育赛事的观看体验。我们还主导建设FVV视频技术国家标准,同时承担了国家“科技冬奥”“冰雪项目交互式多维度观赛体验技术与系统”项目,让更多普通用户享受到新一代观看体验。

二、视频消费商业化新模式-创意广告

在视频消费商业化新模式上,重点在创意广告领域,打造动效酷炫、更原生、可互动的广告形态,通过规模化实现中长尾内容的变现。

具体是构建了综合的三维环境感知和理解算法,在多场景多模态的视频内容理解、云端结合的CG 渲染引擎等领域都有深度探索,并且构建云端结合的c c级渲染引擎,实现AI两大平台(视频打点平台、视频特效生产平台)、一个中心的战略(创意广告制作中心)。

**
三、视频创作新平台-基础素材自动化生产与检索**
002.jpg

在视频理解领域的另一个重要应用,就是搭建了视频创作新平台。

首先,我们实现了基础素材的自动化生产与搜索,将传统的静态人物动作和场景实现升级到shot 级别,支持动态素材的检测与识别。

同时,实现精细化抠图,包括对动态人物和物体场景的提取,使这些素材可以被创作者更快速的应用到新的创作环境中。通过交互式的精细化分割算法,动态地将经典视频中的素材提取出来,实现简易化绿幕的效果。

当大量的素材被生产出来,我们同时提供基于准素材级别的智能化检索系统,用户只需要通过语义的文本或语音输入,就能实现对整个素材库的检索。例如用户搜索“吴倩拥抱”,系统就会呈现出整个《冰糖炖雪梨》中有吴倩拥抱的场景。

**
四、视频创作新平台-封面图自动化生产**

003.png
另外,我们实现了封面图自动化生产。基于主要人物、场景、美学评级、元素多样性等方面生成不同维度的封面图,并提供智能裁剪服务,满足16:9、4:3或者3:4等各种场景需求。同时在某些场景中实现动图的自动化生产,即实现千人千面的内容+素材的统一个性化推荐,助力运营分发的提效。

五、视频创作新平台-模板式视频半自动化生产

鉴于优酷有海量的IP版权内容,我们研发了一系列的剪辑合成技术,自动对视频的故事线、内容模板进行提取,并在此基础上在海量视频中进行智能化的二次创作,实现如节目卡点剪辑、Video Highlight & Summary技术生成的前情提要等产品。同时具备视频的形态转换技术,将横版的视频通过AI算法,识别显著性主体区域并进行美学评判,实现竖版视频的自动化生产。

这些技术能够有效的为商业化提供更多素材,同时为B端提供更多能力。
004.jpg

在这个基础上,我们才能实现基于元素级的视频深度理解技术,我们将传统的基于用户行为的内容分发体系和基于视频内容理解的视频内容分发体系进行了有效结合,实现了群体智慧和计算机视觉在美学和AI上的融合,实现了从整个封面图内容的原数据分析,到整个用户行为偏好的判断,实现千人千面的内容加素材的个性化推荐,有效提升整个业务场的分发效率。

相关文章
|
8天前
|
传感器 人工智能 监控
AI与物联网的融合:开启智能化未来的新篇章
AI与物联网的融合:开启智能化未来的新篇章
162 96
|
2天前
|
存储 人工智能 自然语言处理
AI Agent与SaaS工具协同发展的未来:企业智能化的全新范式
AI Agent以自主性和智能化为核心,适合复杂任务的动态执行;而SaaS工具则注重服务的完整性和易用性,适合标准化业务需求。
32 14
AI Agent与SaaS工具协同发展的未来:企业智能化的全新范式
|
3天前
|
机器学习/深度学习 人工智能 算法
AI在体育分析与预测中的深度应用:变革体育界的智能力量
AI在体育分析与预测中的深度应用:变革体育界的智能力量
49 31
|
8天前
|
机器学习/深度学习 人工智能 资源调度
基于AI的运维资源调度:效率与智能的双重提升
基于AI的运维资源调度:效率与智能的双重提升
77 16
基于AI的运维资源调度:效率与智能的双重提升
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型,支持高分辨率图像处理和双语交互,能够预测并执行GUI操作,广泛应用于自动化任务。
55 12
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
|
7天前
|
存储 人工智能 开发框架
Eliza:TypeScript 版开源 AI Agent 开发框架,快速搭建智能、个性的 Agents 系统
Eliza 是一个开源的多代理模拟框架,支持多平台连接、多模型集成,能够快速构建智能、高效的AI系统。
84 8
Eliza:TypeScript 版开源 AI Agent 开发框架,快速搭建智能、个性的 Agents 系统
|
2天前
|
人工智能 自然语言处理 监控
从数据洞察到动态优化:SaaS+AI引领智能化服务新时代
SaaS(软件即服务)结合AI(人工智能),正引领企业解决方案向智能化转型。SaaS+AI大幅提升了工作效率与决策质量。它能自动完成重复任务、简化设置流程、主动识别并解决潜在问题,还能根据用户需求提供个性化推荐和动态优化配置。
21 1
从数据洞察到动态优化:SaaS+AI引领智能化服务新时代
|
4天前
|
消息中间件 机器学习/深度学习 人工智能
AI赋能运维:实现运维任务的智能化自动分配
AI赋能运维:实现运维任务的智能化自动分配
60 23
|
5天前
|
机器学习/深度学习 人工智能 监控
AI在交通管理系统中的应用
AI在交通管理系统中的应用
41 23
|
7天前
|
人工智能 运维 监控
AI辅助的运维流程自动化:实现智能化管理的新篇章
AI辅助的运维流程自动化:实现智能化管理的新篇章
306 22

热门文章

最新文章