“视网膜”重装来袭 AI技术为视频业务场景赋能

简介: 阿里云解决方案总经理刘澍泉在主题为《云转型之路》的演讲中讲到,人工智能已经进入到产业化的阶段,我们可以看到,人工智能和更多垂直化行业、和细节产业的结合。人工智能和视频云的技术结晶——“视网膜”视频云智能视频解决方案,也在演讲中正式对外发布。

在上周在北京圆满落幕的云栖大会北京峰会之上,AI是一个热门词。阿里云在峰会主论坛现场首次公开展示了AI布局,提出了产业AI的概念,发布了整合城市管理、工业优化、航空调度等全局能力为一体的ET大脑,将人工智能赋能于生活中的各处场景。

阿里云解决方案总经理刘澍泉在主题为《云转型之路》的演讲中讲到,人工智能已经进入到产业化的阶段,我们可以看到,人工智能和更多垂直化行业、和细节产业的结合。人工智能和视频云的技术结晶——“视网膜”视频云智能视频解决方案,也在演讲中正式对外发布。
image

我们知道,在视频领域中,依托视觉计算技术,视频的处理效率可以得以提升,我们也可以对视频内容进行更深层次的理解和数据挖掘,两者的结合能为产业带来更多的可行性。那么阿里云在视频AI技术领域拥有哪些能力?我们先来看一个具体场景。

当你疲惫的回到家,想选择一档视频节目来观看的时候,你只能通过标题简单粗暴地对节目内容进行判断,你可能花费了20分钟,却选择了一个看了5分钟就放弃了的节目,因为你对它并不感兴趣。所以,当视频的内容能够被人工智能读懂,这个场景就会被改写。在云栖大会北京峰会的现场,阿里云解决方案总经理刘澍泉现场为大家解答了这一改变是如何实现的。

image

改变正是来自于阿里云视网膜——视频云智能视频解决方案,这是基于阿里云海量视频的分布式计算和流媒体处理能力,利用机器学习、模式识别、计算机视觉等人工智能模块对媒体数据进行分析、理解和处理。

首先,视网膜系统可以针对人脸进行人物分析,基于深度学习技术和海量人脸数据库,对视频画面中出现的名人、明星等人物进行人脸识别,现场的演示可以看出,影视片花中人物的索引被轻松地、准确无误地呈现出来。不仅如此,视网膜系统还可以通过用户上传人脸照片完成人脸注册,视频中如果出现这个人脸,就可以被识别出来。

其次,通过视频内容理解和用户行为分析,视网膜系统可以将视频中最能诠释视频内容的一帧拿出来做为展示页面,更可以对核心内容进行动态截取,精准的向观看者输出视频封面。视频首图和视频摘要功能降低了观看者的选择复杂度,可以有效提升视频的点击率。
image

除此之外,视网膜视频云智能解决方案还拥有视频分类、多模态分析、标签预测,视频内容审核等多项能力,可以有效提升视频的分发、管理效率。

不仅仅是把视频内容结构化,视网膜系统也可以针对语音进行动态识别,从现场演示中我们可以看到,视频中的每一句对话都被快速、准确地转化成文本,并且形成时间轴可以被选择播放。值得一提的是,视网膜系统也可以把OCR(视频中出现的文字)轻松地识别出来。

image
(阿里云视网膜系统视频理解能力与应用场景解读)

我们可以看到,依托于视网膜系统,视频的内容已经完全被结构化处理。当我们分析视频的时候,不再依靠人力,而是依靠人工智能技术。阿里云解决方案总经理刘澍泉表示:“通过智能视频的解决方案,视频处理的整体效率提升了3600倍。我们可以把它赋能给传媒广电行业,让其进行长媒体到短媒体的加工,我们也可以赋能给UGC内容生产的平台,让其生产出内容更精彩的小视频。”

_

通过技术融合升级,视频处理的效率得以提升。与此同时,阿里云也带来降价的利好消息,视频产品流量&带宽价格最高降价34%,同时华北5 ECS降价25%,基础设施再次释放技术红利,视频产业的发展得以加速,这是真正的产业赋能。

目前,阿里云视网膜——视频云智能视频解决方案已经在官网开放试用申请,大家可以通过视网膜线上平台上传视频,观看识别的效果,欢迎大家前来测试,如有问题可留言反馈。

目录
相关文章
|
1天前
|
存储 人工智能 自然语言处理
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
|
1天前
|
人工智能 自然语言处理 数据挖掘
Claude 3.5:一场AI技术的惊艳飞跃 | AIGC
在这个科技日新月异的时代,人工智能(AI)的进步令人惊叹。博主体验了Claude 3.5 Sonnet的最新功能,对其卓越的性能、强大的内容创作与理解能力、创新的Artifacts功能、视觉理解与文本转录能力、革命性的“computeruse”功能、广泛的应用场景与兼容性以及成本效益和易用性深感震撼。这篇介绍将带你一窥其技术前沿的魅力。【10月更文挑战第12天】
8 1
|
2天前
|
人工智能 关系型数据库 数据中心
2024 OCP全球峰会:阿里云为代表的中国企业,引领全球AI网络合作和技术创新
今年的OCP(Open Compute Project)峰会于2024年10月14日至17日在美国加州圣何塞举行,在这场全球瞩目的盛会上,以阿里云为代表的中国企业,展示了他们在AI网络架构、液冷技术、SRv6和广域网等前沿领域的强大创新能力,持续引领全球合作与技术创新。
|
4天前
|
机器学习/深度学习 人工智能 监控
探索AI技术在医疗健康领域的应用与挑战
【10月更文挑战第13天】 本文探讨了人工智能(AI)在医疗健康领域的多种创新应用,包括疾病诊断、个性化治疗、患者监护和药物研发等方面。同时,文章也分析了当前AI技术在实际应用中面临的挑战,如数据隐私、算法透明度、监管问题等,并提出了一些可能的解决思路。通过综合分析,本文旨在为读者提供一个关于AI在医疗领域应用现状及未来的全面视角。
22 3
|
4天前
|
机器学习/深度学习 人工智能 搜索推荐
AI与未来医疗:革命性的技术,重塑健康产业
在21世纪的科技浪潮中,人工智能(AI)正迅速成为医疗领域的关键力量。本文探讨了AI在未来医疗中的潜力和应用前景,从智能诊断、个性化治疗到药物研发和患者护理,详细阐述了AI如何通过提升效率、准确性和个性化医疗服务来重塑健康产业。通过案例分析和专家观点,本文展示了AI在医疗领域的多重影响,并讨论了其面临的伦理和隐私挑战。
|
4天前
|
人工智能 NoSQL 机器人
MongoDB Atlas与YoMio.AI近乎完美适配:推理更快速、查询更灵活、场景更丰富
随着MongoDB的新发布和革新,YoMio.AI的“闪电式发展”值得期待。
|
5天前
|
人工智能 算法 JavaScript
无界 SaaS AI 生态大模型:技术在中国,链接全世界
无界 SaaS AI 生态大模型涵盖前端用户界面、后端服务器逻辑、数据库设计、API 接口开发及区块链技术应用。本文提供一个简化框架,介绍技术栈选择、核心功能模块(用户管理、商城、数据确权、链接力、算力算法、AI 生态大模型、全球化支持)及后端示例代码,帮助将商业模式转化为代码。
|
6天前
|
人工智能 Serverless
AI助理精准匹配------助力快速搭建Stable Difussion图像生成应用
【10月更文挑战第7天】过去在阿里云社区搭建Stable Diffusion图像生成应用需查阅在线实验室或官方文档,耗时且不便。现阿里云AI助理提供精准匹配服务,直接在首页询问AI助理即可获取详细部署步骤,简化了操作流程,提高了效率。用户可按AI助理提供的步骤快速完成应用创建、参数设置、应用部署及资源释放等操作,轻松体验Stable Diffusion图像生成功能。
|
7天前
|
传感器 机器学习/深度学习 人工智能
AI在智能制造中的革新应用与未来展望
【10月更文挑战第10天】AI在智能制造中的革新应用与未来展望
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
探索未来:AI技术的发展与应用
【10月更文挑战第9天】探索未来:AI技术的发展与应用
32 2