智能媒体生产 ICE 使用及原理介绍(一)|学习笔记

简介: 快速学习智能媒体生产 ICE 使用及原理介绍(一)

开发者学堂课程【视频云技术入门-1024程序员节创造营公益课智能媒体生产 ICE 使用及原理介绍(一)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/902/detail/14335


智能媒体生产 ICE 使用及原理介绍(一)


目录:

一、架构与服务层次

二、ICE

三、时间线

四、三一站式开发接入

 

一、架构与服务层次

image.png

频生产与消费全链路

采集——生产制作——管理——分发——消费

互联网流量:70%以上来自视频

专业拍摄——民用设备——专业非编包括一键美颜和在线剪辑

人工编审——包括智能媒资和智能审核

节目单——按需个性化 观看——互动

趋势:从人工到智能,从小众到大众,从被动接收到个性互动

 

二、ICE

ICE 解决什么问题

image.png

云上生产制作

1.云端剪辑制作合成(导出)
2.素材库管理与公共素材的使
3规模化剪辑制作合成
4.专业、高效剪辑制作合成
5.Al 能力辅助生产制作

6. 无干预的全智能生产制作
2、ICE 整体流程

内容资源库(素材库+成片库)——智能生产制作——影像内容消费

内容资源库(素材库+成片库)可以自制 外购 PGC/UGC 直播流,包括音视频 图片 元数据 富文本 故事板,之后进行智能分析与处理包括人脸 语音 OCR NLP 场景 镜头 抠像 色彩,再进行内容创作者包括移动端制作 Web 制作工具 模板工厂生产制作 AL辅助生产制作等

3、ICE 技术架构

场景 剪切拼接拆条 字幕生产 音频处理   图文包装 同频多轨 转场特效 模板化生

实时制作 智能剪辑 SaaS服务/页面 素材管理 成片管理 发布管理 

媒资管理/搜索页面 生产制作页面 ......

智能时间线编排          

创作类(如:集锦、拆条)

增强类(如:智能字幕)

替换类(如:背景替换)

原子 AIl 算法

Face OCR Label Pose ASR DNAShot Category NLP

工具(多端:Web/Mobile/PC)  

故事板

Manual Timeline

Al Timeline

效果编辑  播放器

Preview 渲染引擎

AP

生产制作服务

模板工厂

Timeline 处理中心

渲染合成

多层视频 多轨混音

智能引擎  特效

内容库 音视资源库 直播流 模板云制作工程 人物库 标签库 版权节目 镜头库

4、ICE 服务层次

WebSDK

云端一体 可分可合的 PaaS(云服务)/PaaS+(WedSDK)

标准剪辑

资源 视觉音频/效果轨道。青视图文素材。速镇/转场特效
交互 剪切拼撞多层视频/图像多轨混查. 效果编辑,预览

直播剪辑
资源直播流 (停止停止后转点播均支持)

交互 双播器(直播源,剪辑后片段)。单轨剪切

模板工厂剪辑
资源 轨道。素材,效果与标准剪辑一致
依题时间线创建模板。模板可变参数替换
大子组件
剪期时间线(多轨.多素材.多种效果)
剪辑播放器(素材播放.时间线效果预览与播放)

云服务
OpenAPI
剪辑制作 标准剪辑 提交剪辑合成作业 查询剪辑合成作业

直播剪辑 提交直播剪辑作业 查询直播剪辑作业

云剪辑工程 剪辑工程的增删改查

剪辑工程素材的增删查
内容库 内容库资源的增删改查

公共素材库(标签)的获取

公共内容平台相关服务
智能任务 ASR 智能字幕,视频/图片横转竖、视频/图片智能模糊。视频图片绿幕抠像。智能语音任务的提交

只能任务的获取,删除
模板工厂 模块的增 删 该 查

公共配置 事件通知的设置和获取

事件通知 MNP 回调 Http 回调 剪辑合成回调

5、ICE 基本概念

素材 用于剪辑制作的原材料。类型可以是视频、纯音频、图片、独立字幕等。
时间线 音视图文多层轨道、多个素材、多类效果按照视频创作思路编排的过程和结果,同时也是剪辑合成的依据,这是ICE最重要的数据结构,也是整个视频生产制作的核心。
模块 将时间线的素材编排规律、转场/滤镜/特效规律以及其他规律予以抽象并进行固定化、标准化的结果。模板相比较时间线,使用起来更方便,也更容易进行规模化制作。
云剪辑工程 用于描述一次视频创作过程中涉及的数据。-般包括基本元数据(如标题、创建时间等),本次视频创作所需的素材,以及描述实际视频创作内容的时间线。
剪辑合成任务 当视频创作完成后,可将最终制作好的时间线或模板提交合成,生成新的媒体资源。媒体资源的合成是一一个异步的过程,剪辑合成任务则描述了任务从开始创建到最终完成的过程。
成片 剪辑制作合成(导出)的目标产物。成片在这里是个广义的概念,针对当次剪辑的输出。因此,这次的成片也可作为下次的素材继续进行创作。
智能任务 在剪辑制作及合成的过程中,我们可以对素材或者生成目标媒体资源的过程进行智能处理,智能任务则用来描述对应的智能处理过程。

6、ICE 核心链路与设计规则

核心链路

输入———处理——输出

输入

ICE 内容库
来源: VOD 媒资. OSS 对象、直播流
类型:音视图文.直播流等泛媒体资源

处理

剪辑、包装、渲染与合成
●最核心的对象:时间线 Timeline

●过程:剪辑合成服务的异步处理

●高级管理:云剪辑工程及素材管理

●提效:模板工厂、并行剪辑、智能生产

输出

ICE 内容库
●目标: VOD 媒资. OSS 对象
●最核心设计规则:源文件输入输出

●类型:视频、纯音频,动图、字幕、时间线等

源文件输入输出规则

ICE 剪辑输入(素材等)

内容库资源有原始文件和转码输出文件 0—N,而原始文件可以转码为转码输出文件,原始文件合成原始文件,之后转码成转码输出文件 0—N,一起构成内容库资源

●目标媒体资源分所率
在没有手动指定的情况下。与 Timeline 所使用的素材源文件分辨率有关:取其最大宽高。
例如: Timeline 使用了3个素材, 其源文件分辨率分别为: 1280x720, 1920x1080, 720x1280,则目标成片的分解率为1920x1280
●目标媒体资源码率
在没有手动指定的情况下,与Timeline所使用的素材源文件码有关,取其最大码(若超过码率上限则以码上限为准)
●目标媒体资源格式
在没有手动指定的情况下,默认视频的格式为 H.264/mp4;音倾为 aac

内容库设计—开发性 灵活性 跨产品协作分为四个部分

image.png

A 范媒体管理  视频 纯音频 图片 字幕 直播流等

B 跨产品融合 ICE 媒资 VOD 媒资 直播流

C 开放性 用户内容库 公共素材库(内容)

D 统一管理范围 素材(源) 成品(目标) 临时资源

 

相关文章
|
小程序 安全 API
支付宝消息订阅
订阅界面是根据当前小程序在商家平台配置的消息模板 id 来展示对应消息的订阅选项(参考接入流程第 4 步)。一次性:使用一次性消息模板订阅,每次向用户发送消息都需要用户在订阅界面点击同意后才可以发送。长期性:使用长期性消息模板订阅,用户同意订阅后,可以多次向订阅用户发送消息。
668 0
 支付宝消息订阅
|
搜索推荐 Java 数据库
基于SpringBoot校园二手书交易管理系统
基于SpringBoot校园二手书交易管理系统
|
数据可视化 JavaScript 前端开发
Qt Quick 定时技巧全攻略:从底层原理到高级应用(二)
Qt Quick 定时技巧全攻略:从底层原理到高级应用
629 0
|
4月前
|
Linux 虚拟化 iOS开发
macOS Tahoe 26 beta 2 (25A5295e) ISO、IPSW、PKG 下载
macOS Tahoe 26 beta 2 (25A5295e) ISO、IPSW、PKG 下载
156 0
macOS Tahoe 26 beta 2 (25A5295e) ISO、IPSW、PKG 下载
|
2月前
|
数据采集 缓存 JSON
GitHub 开源爆款工具|MediaCrawler:程序员零门槛采集抖音/小红书/B站等社交评论,30K star 背后的场景实战揭秘!
MediaCrawler 是一个支持多平台的社交媒体数据爬虫工具,覆盖小红书、抖音、B站等主流平台,提供关键词/ID爬取、评论采集、登录态缓存、代理池等功能,结合 Playwright 实现浏览器模拟,降低逆向难度,适合内容运营、数据分析等场景,开源免费,使用简便。
348 0
|
监控 数据可视化 调度
ERP系统中的现金流管理与预测
【7月更文挑战第25天】 ERP系统中的现金流管理与预测
783 3
|
11月前
|
算法 编译器 C语言
《C 语言预处理指令:代码编译前的 “魔法棒”》
《C 语言预处理指令:代码编译前的 “魔法棒”》介绍了 C 语言中预处理指令的作用和使用方法,如宏定义、文件包含等,是编程初学者了解代码编译前处理过程的必备指南。
237 12
|
11月前
|
机器学习/深度学习 人工智能 算法
青否数字人声音克隆算法升级,16个超真实直播声音模型免费送!
青否数字人的声音克隆算法全面升级,能够完美克隆真人的音调、语速、情感和呼吸。提供16种超真实的直播声音模型,支持3大AI直播类型和6大核心AIGC技术,60秒快速开播,助力商家轻松赚钱。AI讲品、互动和售卖功能强大,支持多平台直播,确保每场直播话术不重复,智能互动和真实感十足。新手小白也能轻松上手,有效规避违规风险。
|
12月前
|
人工智能
青否数字人直播间五大互动,承诺抖音封号即退款!
青否数字人直播系统通过五大互动策略实现真正的无人直播,包括AI智能互动、关键词互动、氛围引导、弹幕文字互动和真人接管。系统支持独立部署,一次买断终身使用,具备无限量声音和形象克隆功能,确保直播过程中的实时互动和高质量内容输出。