阿里云视频技术专家柿蒂:视频AI in传媒九大业务场景解析

简介: 人工智能视觉计算和视频融合在一起能摩擦出怎样的火花呢?柿蒂提到,如同下图所示,人工智能视觉计算可以支持直播、短视频、新闻、体育、影视等多种业务场景,可以实现目标检测识别识、片段侦测、事件识别、鉴黄涉恐、OCR等多种应用层面的功能。

近日,BIRTV 视觉人工智能峰会在北京国际饭店隆重举办。阿里云视频技术专家柿蒂受邀参加,围绕人工智能这一主题,在视觉计算与传媒领域的应用进行深度分享。

image
阿里云视频技术专家 柿蒂

人工智能在视频领域的应用

阿里云拥有强大的云计算能力与大数据计算引擎,因此,人工智能也就拥有了飞速发展的沃土。那人工智能视觉计算和视频融合在一起,又能摩擦出怎样的火花呢?柿蒂提到,如同下图所示,人工智能视觉计算可以支持直播、短视频、新闻、体育、影视等多种业务场景,可以实现目标检测识别识、片段侦测、事件识别、鉴黄涉恐、OCR等多种应用层面的功能。

image

从技术角度来讲,基于业界领先的人工智能技术,阿里云可对视频的内容、文字、语音、人脸、物体进行多维度分析理解,帮助视频类、资讯类等客户实现视频分类和打标签、视频指纹、相似性计算、视频安全审核、视频质量计算、自动生成封面图、视频切片化等能力。从而帮助客户提升用户留存和体验,同时提高数据处理能力,降低人工审核成本。

人工智能在视频领域的应用至少包括以下四个大方面:

1、 视频内容分析: 行业领先,基于阿里领先的人工智能技术,对视频进行语音、文字、人脸、物体、场景多维度分析,输出视频泛标签,提升搜索推荐效果。
2、 视频封面选图: 通过对视频内容的理解,并结合画面美学,选出最优的关键帧或关键片段作为视频封面图。
3、 视频指纹: 提取视频中的音频、图像及时序特征,生成视频指纹,通过视频指纹的比对,实现重复视频查找、视频片段的源视频查找等业务功能。可应用于视频去重、侵权视频过滤、原创视频保护等领域。
4、 视频内容审核: 基于深度学习技术和海量数据,智能识别色情、暴恐、广告、涉政等视频或图片,极大节省人工审计成本,降低违规风险。

传媒九大业务场景深入解读

传媒,是人工智能视觉计算的典型应用领域,下面,柿蒂选取了传媒的九大热门业务场景,分享了在每一个业务场景中的视觉计算是如何应用的。

image

业务场景一:自动内容审核

采用基于深度学习的图像分类方法,利用高召回+高精度的级联结构,同时采用人脸识别、OCR、ASR等技术,对音视频中的违禁内容进行审核。
侧重:UGC视频侧重鉴黄、涉暴等;PGC及台内存量视频侧重涉政。

image

业务场景二:视频摘要-自动关键帧

通过对视频进行结构化分析,对关键帧、视频镜头进行筛选和排序,选择最优的关键帧、关键片段来作为视频的展示。并采用关键帧提取+MMR优化+美学评分等方法,选择视频,用以形成视频摘要,方便用户浏览。
效果:人工评测原始与封面关键帧算法(仅评测可对比出优劣之分的数据):算法优,占比超过70%

image

业务场景三:自动拆条

多模态:视频特征、ASR、OCR、人脸、Motion等
可以应用在:

  • 新闻消息类节目的条目拆分(可播前进行,无须文稿)
  • 体育赛事的自动场记
  • 综艺类节目的曲目裁剪及精彩段落生成
  • PGC直播的快速集锦
  • 节目内容热点发现

业务场景四:语音处理

  • 语音转文本:新闻资讯/会议/影视剧制作
  • 语音对齐:将已有的口播稿按稿件句子自动识别时码,与稿件文本对齐
  • 实时字幕:直播或存量视频中,将语音内容转成文本并做实时字幕处理
  • 语音检索:检索节目或素材的语音内容
  • 新闻热线电话/客服:智能质检、智能问答
  • 自动拆条、视频、内容审核等:与视频相结合
  • 知名主持人、明星语音合成:增加互动体验

image

业务场景五:OCR

利用视频结构化分析和图片识别等技术关键点,进行OCR识别处理。
可以应用在:

  • 视频文本摘要的参考:新闻类视频
  • 台词提取及时码对齐:电影电视剧(可结合语音处理)
  • 演职员表

业务场景六:视频去重/检测/关联

利用视频指纹技术,判断两个视频是否是通过任意变换获取的同源视频,以及同源相似度。可以应用在:

  • UGC、PGC视频的去重
  • 广告检测
  • 短视频搜索
  • 基于视频内容的关联

image

业务场景七:视频分类、视频标签

视频分类是通过内容理解的方法对视频进行类目和标签预测;视频标签则是通过对视频中多模态信息进行分析,自动为视频进行标签标注,并利用图像分类技术、视频tagging技术、OCR、ASR、人脸识别、目标检测、行为识别等多模态技术分析,对视频进行自动标签化。

image

业务场景八:目标检测

  • 直播互动:主播手势交互、取代人工,由机器自动生成事件发生的时间点及事件类别
  • 物体动态锚点跟踪:支持用户对视频内容中的物体进行标记并跟踪。
  • 边看边买:在视频中匹配和搜索同款/相似/相关商品,为视频电商的边看边买提供自动选品技术,同时利用用户在淘宝、天猫的用户行为进行边看边买商品的个性化推荐。

image

业务场景九:体育分析

  • 视频打标:取代人工,由机器自动生成事件发生的时间点及事件类别
  • 集锦生成:根据打标信息自动生成比赛场景、球员集锦
  • 比赛转播:自动完成镜头切换、远近景切换,球员特写
  • 球员数据信息获取:跟踪球员轨迹、获取球员在全场比赛中的位置,跑动数据

在分享的最后,柿蒂将所有阿里云AI+视频的能力做了整体展示,他也表示,在未来,阿里云持续探究AI+视频技术,并且将更多优秀的能力开放给行业。

image

目录
相关文章
|
2天前
|
人工智能 自然语言处理 JavaScript
阿里云发布 AI 编程助手 “通义灵码”——VSCode更强了 !!
阿里云发布 AI 编程助手 “通义灵码”——VSCode更强了 !!
22 3
|
2天前
|
人工智能 IDE Devops
通义灵码技术解析,打造 AI 原生开发新范式
本文第一部分先介绍 AIGC 对软件研发的根本性影响,从宏观上介绍当下的趋势;第二部分将介绍 Copilot 模式,第三部分是未来软件研发 Agent 产品的进展。
|
2天前
|
机器学习/深度学习 人工智能 算法
构建高效AI系统:深度学习优化技术解析
【5月更文挑战第12天】 随着人工智能技术的飞速发展,深度学习已成为推动创新的核心动力。本文将深入探讨在构建高效AI系统中,如何通过优化算法、调整网络结构及使用新型硬件资源等手段显著提升模型性能。我们将剖析先进的优化策略,如自适应学习率调整、梯度累积技巧以及正则化方法,并讨论其对模型训练稳定性和效率的影响。文中不仅提供理论分析,还结合实例说明如何在实际项目中应用这些优化技术。
|
2天前
|
消息中间件 人工智能 监控
|
2天前
|
存储 弹性计算 固态存储
阿里云服务器配置选择指南,2024年全解析
阿里云服务器配置选择涉及CPU、内存、带宽和磁盘。个人开发者或中小企业推荐使用轻量应用服务器或ECS经济型实例,如2核2G3M配置,适合网站和轻量应用。企业用户则应选择企业级独享型ECS,如计算型c7、通用型g7,至少2核4G起,带宽建议5M,系统盘考虑SSD云盘或ESSD云盘以保证性能。阿里云提供了多种实例类型和配置,用户需根据实际需求进行选择。
|
2天前
|
人工智能 自然语言处理 IDE
如何让阿里云AI001号员工帮我写代码(含IDEA插件使用)
AI 智能时代,将改变所有人的思维方式,学习方式,更注重人的创造力和思考力,如果你懒,你将会被 AI 替代,如果你只想干简单不用动脑的活,你将会被 AI 替代,如果你只会打螺丝,更会被 AI 替代。当下的 AI 人工智能时代,被认为是第四次工业革命的到来,我们更应该看到的是机会,而非跳进焦虑、困惑、悲观的一群人潮中。
|
2天前
|
人工智能 运维 Serverless
【云故事探索】NO1:看森马服饰,在阿里云上如何用AI实现创新?
在数字化转型中,云计算成为企业创新的关键驱动力。森马服饰借助阿里云函数计算,应对新零售挑战,实现业务模式重塑和效率提升。面对AI技术落地的困难,如高成本、长决策周期和复杂运维,森马通过阿里云的Serverless解决方案,快速将AI融入核心业务,优化了从设计到营销的全链条流程。通过函数计算,森马降低了AI项目初期的硬件投入和运维难题,提升了设计师的工作效率,将设计时间从3天缩短到30秒,实现了服装设计和营销的智能化升级。
|
2天前
|
机器学习/深度学习 人工智能 供应链
【专栏】阿里云RPA的Rap程序是自动化流程脚本,基于AI和机器学习,实现业务流程自动化
【4月更文挑战第29天】阿里云RPA的Rap程序是自动化流程脚本,基于AI和机器学习,实现业务流程自动化。具有灵活性、易用性、高效稳定和智能学习等特点。广泛应用于财务、人力资源、客服和供应链等领域,未来将与AI深度融合,跨平台应用,行业定制化,并构建完善生态,助力企业效率提升和创新。
|
2天前
|
数据采集 安全 测试技术
【专栏】阿里云RPA浏览器自动化插件是一款基于AI的创新工具
【4月更文挑战第29天】阿里云RPA浏览器自动化插件是一款基于AI的创新工具,能模拟浏览器操作,实现自动化业务流程,提升效率,降低成本。其特点包括强大的自动化能力、智能识别处理、灵活定制、稳定性能及安全保障。适用于数据采集、表单填写、网页测试、办公自动化和电商运营等场景,助力企业数字化转型。
|
2天前
|
运维 网络协议 安全
Serverless 应用引擎产品使用之阿里云函数计算中添加自定义域名进行域名DNS验证如何解决
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
25 1

热门文章

最新文章

推荐镜像

更多