达摩院机器智能多媒体AI产品介绍

简介: 近年来,在计算机视觉领域中比较热门的方向当属视频AI技术,而阿里达摩院机器智能实验室也推出了自己的多媒体AI产品,并且将逐步上线视频AI的相关能力。本文中,达摩院机器智能实验室资深产品专家宋瑛娟将为大家简单介绍达摩院机器智能多媒体AI产品。

本文内容根据演讲视频以及PPT整理而成。

演讲嘉宾介绍:宋瑛娟,达摩院机器智能实验室资深算法专家。

预约观看演讲视频

背景介绍

大家都知道,视频AI技术是近年来计算机视觉中比较热门的方向。而在阿里达摩院,多媒体AI产品就是视频AI产品的一些能力,目前正在ai.aliyun.com官网上进行公测,公测的能力包括了标签能力、内容智能生成能力等。未来,在两到三个月内,达摩院机器智能实验室也会逐步上线更多多媒体AI标签的能力,包括短视频分类、更多动作识别、陌生人脸和负向标签(用于鉴黄等场景)等。预计在2020年3到5月份的时候,还将会上线视频指纹功能,帮助快速检索视频,以及多媒体AI自学习平台,借此来支撑更多深度定制的应用场景。

视频技术-改变传播能力

众所周知,视频技术能够改变传播方式。在互联网上,最早的传播方式是依靠文字,后来出现了图片传播以及图片和文字相结合的传播方式,之后又出现了音频,最后出现了视频的传播形式。对于视频而言,首先其天生就是多模态的。其次,视频在应用场景中,从创作、生产、分发、营销到消费是存在供给和消费闭环的。而对于阿里达摩院而言,所想要做的其实是一些最基础的能力。因此,达摩院对于视频AI的能力分为了三个部分,即智能理解、智能生产和智能分发。智能理解包括对于人、物以及自然和行为的识别和自动分类;智能生产包括智能拆条、智能缩略图、以及智能配乐等;而智能分发则包括了智能检索、版权溯源等。
图片1.png

视频技术-多模态视频理解助力精确检索和高效运营

前面提到,视频天生就是多模态的,而对于多模态数据的理解过程中就天然地会用到一些底层技术,比如对于视频的语音识别,通过OCR支持字幕识别,以及UGC识别等来综合地识别视频中的结构化信息。目前,达摩院的视频标签是比较通用化的,并且还在不断增加,如果有一些比较大的场景还可以和合作伙伴一起构建更多的视频标签。
图片2.png

达摩院机器智能多媒体AI产品2.0版本能够实现3到6倍速的视频处理速度,一个小时的视频最快能够在10分钟之内处理完成,并且能够将视频中的人物、建筑物、文字全部识别出来。在达摩院机器智能多媒体AI产品的后续优化中,会对于人脸的识别做一次大的提升,对于人脸识别的精度以及敏感人物的范围和库进行提升。

视频技术-视频指纹

所谓视频指纹,所想要做的就是基于对于一段视频的结构化理解来决定如何使用,比如在版权保护中判断两段视频是否相同,或者视频如果被分发到线下的广告中是否能够追踪到。实现视频指纹之后,即使视频的质量、空域发生变化,或者视频发生了拼接或者修改,仍然能够对于这段视频进行溯源。
图片3.png

视频技术-视频生成,封面、GIF、摘要、拆条、集锦

基于对于视频的结构化理解,达摩院机器智能多媒体AI产品就能够实现更多的视频应用,比如视频生成,封面、GIF、摘要、拆条、集锦等。目前,达摩院机器智能多媒体AI产品在线上比较重要的能力就是封面和GIF的生成技术,目前有很多厂商已经应用了。未来,达摩院机器智能多媒体AI产品将会在线上推出场景拆条和体育类集锦功能。并且继续优化封面和GIF能力,做到基于场景级别的静态、动态封面的生成。同时根据视频内容质量的抽取以及前端分发的质量度量,结合智能决策,对生成内容进行最优化前端触发。阿里在优酷的场景里面做了一些实验,帮助优酷将CTR提升了15%。
图片4.png

应用案例

目前,达摩院机器智能多媒体AI产品现在正在和央视进行合作,在央视的媒资库里面会做一些视频结构化的应用。简单而言,第一点就是素材结构化生成,第二点就是在媒资库中进行检索,第三点就是根据一些片段找到与国家领导人相关的片段并展示出来。
图片5.png

相关文章
|
3天前
|
人工智能 自动驾驶 算法
智能时代的伦理困境:AI决策的道德边界
在人工智能技术飞速发展的今天,我们面临着前所未有的伦理挑战。本文探讨了AI决策中的道德边界问题,分析了技术发展与人类价值观之间的冲突,并提出了建立AI伦理框架的必要性和可能路径。通过深入剖析具体案例,揭示了AI技术在医疗、司法等领域的应用中所引发的道德争议,强调了在追求技术进步的同时,必须审慎考虑其对社会伦理的影响,确保科技发展服务于人类的福祉而非成为新的困扰源。
|
2天前
|
人工智能 自然语言处理 机器人
对话阿里云 CIO 蒋林泉:AI 时代,企业如何做好智能化系统建设?
10 月 18 日, InfoQ《C 位面对面》栏目邀请到阿里云 CIO 及 aliyun.com 负责人蒋林泉(花名:雁杨),就 AI 时代企业 CIO 的角色转变、企业智能化转型路径、AI 落地实践与人才培养等主题展开了讨论。
146 19
对话阿里云 CIO 蒋林泉:AI 时代,企业如何做好智能化系统建设?
|
1天前
|
人工智能
1024 云上见 AI大模型助力客户对话分析 2000个智能台灯等你来领
1024 云上见 AI大模型助力客户对话分析 2000个智能台灯等你来领
13 3
|
3天前
|
人工智能 运维 监控
智能化运维:AI在IT运维中的挑战与机遇###
本文探讨了人工智能(AI)技术在IT运维领域的应用,重点分析了AI如何提升运维效率、减少故障恢复时间,并预测未来发展趋势。通过具体案例展示了AI在实际运维中的应用效果,同时指出当前面临的挑战和解决方案,为读者提供一个全面了解智能化运维的视角。 ###
|
4天前
|
人工智能 弹性计算
|
2天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:AI在IT运维中的应用探索###
随着信息技术的飞速发展,传统的IT运维模式正面临着前所未有的挑战。本文旨在探讨人工智能(AI)技术如何赋能IT运维,通过智能化手段提升运维效率、降低故障率,并为企业带来更加稳定高效的服务体验。我们将从AI运维的概念入手,深入分析其在故障预测、异常检测、自动化处理等方面的应用实践,以及面临的挑战与未来发展趋势。 ###
|
2天前
|
机器学习/深度学习 人工智能 安全
智能时代的隐私守护者:AI加密技术的崛起与挑战###
本文深入探讨了人工智能(AI)在数据加密领域的创新应用,分析了AI如何增强数据安全性,同时也指出了面临的挑战和未来发展趋势。通过具体案例分析,展现了AI加密技术在保护个人隐私与促进数据安全方面的潜力,为读者提供对未来智能时代隐私保护的深刻洞见。 ###
|
4天前
|
人工智能 API 数据安全/隐私保护
[大语言模型-工程实践] 手把手教你-基于Ollama搭建本地个人智能AI助理
[大语言模型-工程实践] 手把手教你-基于Ollama搭建本地个人智能AI助理
31 0
|
5天前
|
人工智能 算法 安全
阿里云国际版设置四层AI智能防护
阿里云国际版设置四层AI智能防护
|
5天前
|
人工智能 算法 数据挖掘
AI心语:智能代码与人为艺术的融合
在这个数字时代,人工智能似乎无所不能。它下棋能赢过世界冠军,写文章可骗过编辑,甚至画画能展览于画廊。但AI真的懂得创作吗?还是它仅仅是高级的模仿者?本文将深入探讨AI在艺术创作中的角色,以及它对人类创造力的影响。