智能媒体处理使用与原理(二)|学习笔记

简介: 快速学习智能媒体处理使用与原理(二)

发者学堂课程【视频云技术入门-1024程序员节创造营公益课智能媒体处理使用与原理(二)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/902/detail/14336


智能媒体处理使用与原理(二)


三、音视频智能处理

1、绿幕抠图
传媒影视制作必备工具
输入:
1.蓝幕或绿幕视频,分辨率不超过4K

2.需要替换的背景图片
输出:
1.替换背景后的视频
典型应用场景:

●影视制作

●多人云会议

●元宇宙
抠图质量评价点:

●边缘溢色
●透明体反光

●运动模糊

●地面阴影

2横转竖

移动端分发必备工具

人工制作横转竖视频的难点
a 剪裁目标区域后,前后帧难以对齐
b 目标移动比较快的场景需要逐帧剪裁工作量巨大
c 需要专业剪辑软件和制作人员成本高,速度慢

智能横转竖的算法流程
镜头分割——主体选择——镜头追踪——路径平滑

其他视频智能处理能力

阿里云视频云目前提供的视频 AI 能力

的阿里云开发者训练
其他视频智能处理能力阿里云视频云目前提供的视频 AI 能力
ROI 提取●绿幕抠图●横转竖
智能擦除●去图标●去字幕
关键信息提炼●智能封面●视频摘要
结构化分析●字幕提取●PPT 拆条

3副歌识别

副歌-歌曲中的高潮片段,自动识别副歌加速推荐分发,提升点击转化率
歌曲——音乐段落检测——副歌段落提取——副歌段落精调——副歌片段

示例({"result": [{"start": 72.38,

"end": 102.38,

"title": "副歌"}

 }

}

4、节奏检测

识别音乐中的多层次的节奏点

应用场景包括视频制作:

如鬼畜视频音乐推荐:帮助分类音乐

示例

{

"result: 'success" ,

"Beatlist":["0.46" ,"0.96" ,'1.45", ,"1.96". ,"2.46" ,2.99" ,"3.48","3.98","4.48","4.98" ,"5.47","5.96" ,"6.46"],"DownBeatlist":[

"0.46","2.46" ,"4.48" ,"6.46"]

}

5其他音频智能处理能力

●混音

●ASR (语音识别)

●TTS (语音合成)

 

四、MPS 服务介绍

1NPS 服务介绍

媒体处理

阿里云媒体处理(ApsaraVideo Media Processing,原 MTS)是-

多媒体数据处理服务。它经济。弹性和高可扩展的转换方法,将多媒

体数据转码成适合在全平台播放的格式。并基于海量数据深度学习,

对媒体的内容、文字语音、场凰多模志分析,实现智能审核。内容理

解、智能编机。

Input Media File——Output Media File (如横转竖)
Input Media File_——Output Analyzed Data (如智能标签)

输入媒体文件支持:●OSS 文件

●网络 URL 地址

如何调用 MPS 接口

开通 MPS 产品:https://www.aliyun.com/product/mts
使用 RAM 服务获取

AccessKey:https://ram.console.aliyun.com/manage/ak

仔细阅读 MPS API 文档:

https://help aliyun.com/document_detail/29210.html
选择编程语言,安装依赖模块,可参考:

https://help.aliyun.com/document_detail/188024.html .

5.编写代码

相关文章
|
3月前
|
人工智能 边缘计算 监控
【开源视频联动物联网平台】视频AI智能分析部署方式
【开源视频联动物联网平台】视频AI智能分析部署方式
277 3
|
机器学习/深度学习 人工智能 小程序
智能媒体处理使用与原理(一)|学习笔记
快速学习智能媒体处理使用与原理(一)
159 0
智能媒体处理使用与原理(一)|学习笔记
|
人工智能
智能媒体处理使用技巧
智能AI与视频制作
170 0
|
机器学习/深度学习 人工智能 语音技术
视频AI,助力体育赛事转播走进智能时代
2018俄罗斯世界杯经过近20天的激战,已经进入到最关键的阶段。本次赛事除了精彩纷呈的比赛之外,还加入很多高科技的元素,例如门线、VAR技术等等。让本届世界杯成为科技含量最高的一届世界杯。
2821 0
|
编解码 开发者
如何开通媒体转码服务|学习笔记
快速学习如何开通媒体转码服务
186 0
如何开通媒体转码服务|学习笔记
|
编解码 开发者
媒体转码服务计费说明|学习笔记
快速学习媒体转码服务计费说明
273 0
媒体转码服务计费说明|学习笔记
|
机器学习/深度学习 新零售 人工智能
新一代视频AI服务 —— 阿里云智能视觉重磅发布
3月27日下午,第51期阿里云产品发布会-智能视觉产品隆重发布,本次产品发布会内容涵盖产品特性、应用场景、技术原理解读、开发者实战实操等内容,首次面向全网用户深入的解读了智能视觉的前世今生。 行业背景 随着人工智能的技术不断成熟, AI逐渐在各行业内落地。
4356 0
新一代视频AI服务 —— 阿里云智能视觉重磅发布
|
JavaScript Java Android开发
如何基于OSS和MPS,快速搭建音视频文件上传服务?
背景 本文主要介绍如何基于OSS服务和MTS的上传SDK,快速搭建一个音视频文件上传服务。 优势 使用MTS的上传SDK上传音视频文件,具有以下优势: 增加文件列表管理功能。 增加STS Token 超时更新功能。
13772 0
|
存储 编解码 对象存储
【转码系列之二】如何快速使用阿里云媒体转码服务和媒体库?
今天来给大家介绍一下如何快速使用阿里云媒体转码服务和媒体库。
7409 0
|
2月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之如何解决视频生成接口中声音和画面不同步
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
视觉智能开放平台产品使用合集之如何解决视频生成接口中声音和画面不同步

热门文章

最新文章