开发者学堂课程【视频云技术入门-1024程序员节创造营公益课:智能媒体处理使用与原理(二)】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/902/detail/14336
智能媒体处理使用与原理(二)
三、音视频智能处理
1、绿幕抠图
传媒影视制作必备工具
输入:
1.蓝幕或绿幕视频,分辨率不超过4K
2.需要替换的背景图片
输出:
1.替换背景后的视频
典型应用场景:
●影视制作
●多人云会议
●元宇宙
抠图质量评价点:
●边缘溢色
●透明体反光
●运动模糊
●地面阴影
2横转竖
移动端分发必备工具
人工制作横转竖视频的难点
a 剪裁目标区域后,前后帧难以对齐
b 目标移动比较快的场景需要逐帧剪裁工作量巨大
c 需要专业剪辑软件和制作人员成本高,速度慢
智能横转竖的算法流程
镜头分割——主体选择——镜头追踪——路径平滑
其他视频智能处理能力
阿里云视频云目前提供的视频 AI 能力
的阿里云开发者训练
其他视频智能处理能力阿里云视频云目前提供的视频 AI 能力
ROI 提取●绿幕抠图●横转竖
智能擦除●去图标●去字幕
关键信息提炼●智能封面●视频摘要
结构化分析●字幕提取●PPT 拆条
3副歌识别
副歌-歌曲中的高潮片段,自动识别副歌加速推荐分发,提升点击转化率
歌曲——音乐段落检测——副歌段落提取——副歌段落精调——副歌片段
示例(
{
"result": [
{
"start": 72.38,
"end": 102.38,
"title": "
副歌
"
}
}
}
4、节奏检测
识别音乐中的多层次的节奏点
应用场景包括视频制作:
如鬼畜视频和音乐推荐:帮助分类音乐
示例
{
"result: 'success" ,
"Beatlist":[
"
0
.46" ,
"0.96" ,
'1.45", ,
"1.96". ,
"2.46" ,
2.99" ,
"3.48",
"3.98",
"4.48",
"4.98" ,
"5.47",
"5.96" ,
"6.46"
],
"DownBeatlist":[
"
0
.46",
"2.46" ,
"4.48" ,
"6.46"
]
}
5其他音频智能处理能力
●混音
●ASR (语音识别)
●TTS (语音合成)
四、MPS 服务介绍
1NPS 服务介绍
媒体处理
阿里云媒体处理(ApsaraVideo Media Processing,原 MTS)是-
多媒体数据处理服务。它经济。弹性和高可扩展的转换方法,将多媒
体数据转码成适合在全平台播放的格式。并基于海量数据深度学习,
对媒体的内容、文字语音、场凰多模志分析,实现智能审核。内容理
解、智能编机。
Input Media File——Output Media File (如横转竖)
Input Media File_——Output Analyzed Data (如智能标签)
输入媒体文件支持:●OSS 文件
●网络 URL 地址
如何调用 MPS 接口
开通 MPS 产品:https://www.aliyun.com/product/mts
使用 RAM 服务获取
AccessKey:https://ram.console.aliyun.com/manage/ak
仔细阅读 MPS API 文档:
https://help aliyun.com/document_detail/29210.html
选择编程语言,安装依赖模块,可参考:
https://help.aliyun.com/document_detail/188024.html .
5.编写代码