智能媒体处理使用与原理(一)|学习笔记

简介: 快速学习智能媒体处理使用与原理(一)

发者学堂课程【视频云技术入门-1024程序员节创造营公益课智能媒体处理使用与原理(一)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/902/detail/14336


智能媒体处理使用与原理(一)


目录

一、概念

二、视频内容理解

三、音视频智能处理

四、MPS 服务介绍

 

一、概念

1、智能生产全链路(媒体 AL 加速媒体生产)

采集●绿幕抠图●智能擦除●超分●SDR 转 HDR
编辑●智能横转竖●智能提取封面●智能字幕●智能拆条
存储●智能标签●内容安全审核●智能技检●知识图谱
管理●多模态搜索●人物搜索●素材搜索●版权水印
分发●音视频 DNA●湖源水印●直播审核●存证上链
2、视频 Al 的原理

image.png

机器学习 例如决策树 支持向量机 随机森林 人工神经网络 遗传算法

更深更大

解决图像输入问题

AL 是大数据喂出来的云和 A L 是天然的结合

3如何评价 AI 效果
典型分类问题的例子:在100个视频中找出出现过人的视频
●精度:假设找出50个,其中40个是真正有人的,那么精度=0.8
●召回率:假设100个视频中真正有人的一共有80个,找出的视频中真正有人的是40个,那么召回率=0.5

精度和召回是一对矛盾

换句话来说,现阶段 AL 还做不到完美,AL 还只能辅助视频生产,生产视频的主体还是人。

Al 如何辅助生产

示例1:

通过图片搜索所有相关视频

示例2:

智能如何辅助生产

 

二、视频内容理解

1视频标签

正向的视频内容理解,基于海量视频数据的深度学习,自动提取视频中的标签,关键词等信息

视频包括视频抽帧提取音频
视频抽帧人脸识别 场景识别 物体识别 地标识别 OCR等——视频标签
提取音频 ASR NLP——文本标签

2视频审核

负向的视频内容理解,基于海量视频数据的深度学习,帮助开发者识别内容安全风险

场景名称

描述

检测结果分类

智能鉴黄

检测是否包含色情、性感内容。

正常、色情.性感

暴恐涉政

检测是否包含暴恐或涉政类内容。

正常、血腥、爆炸烟光、特殊装東.特殊标识、武器涉政、打斗.聚众.游行、车祸现场、旗帜、地标

违规

检测是否包含广告和文字违规信息。

正常、文字含涉政内容、文字含涉黄内容、文字含辱骂内容、文字含暴恐内容、 文字含违禁内容、文字含其他垃圾内容、牛皮癣广告、含维码、含小程序码、其他广告

二维码

检测是否包含二维码或小程序码

正常、含二维码、含小程序码

不良场景

检测是否包含黑屏、黑边、昏暗画面、画中画、吸烟、等不良场景。

正常、无内容(例如黑屏、白屏) .画中画、吸烟、车内直播播

logo

检测是否包含logo信息,例如台标,商标等。

正常、含受管控的 logo.含商标

 

3、视频检索

智能标签的核心应用场景;如何搭建视频检索系统?

媒资系统导入媒资视频媒资特征入库模块,然后提交标签分析入 MPS 智能标签分析,提交 DNA 分析入 MPS 视频 DNA 检索,分析结果入库,包含:标签 标描 ASR 检索入 EIasticSearch

十年多稳态检测——检索业务层模块——结果精排模块

这个是多模态检索系统

相关文章
|
6月前
|
人工智能 边缘计算 监控
【开源视频联动物联网平台】视频AI智能分析部署方式
【开源视频联动物联网平台】视频AI智能分析部署方式
358 3
|
机器学习/深度学习 人工智能 编解码
智能媒体处理使用与原理(二)|学习笔记
快速学习智能媒体处理使用与原理(二)
137 0
|
人工智能
智能媒体处理使用技巧
智能AI与视频制作
183 0
|
机器学习/深度学习 人工智能 语音技术
视频AI,助力体育赛事转播走进智能时代
2018俄罗斯世界杯经过近20天的激战,已经进入到最关键的阶段。本次赛事除了精彩纷呈的比赛之外,还加入很多高科技的元素,例如门线、VAR技术等等。让本届世界杯成为科技含量最高的一届世界杯。
2872 0
|
2月前
|
人工智能 自然语言处理
业界首家!阿里云智能媒体服务,卓越级通过中国信通院大模型媒体处理评估
阿里云智能媒体服务作为业界首家获得中国信通院“卓越级”通过。
业界首家!阿里云智能媒体服务,卓越级通过中国信通院大模型媒体处理评估
|
编解码
突破媒体转码效率壁垒 阿里云首推倍速转码
阿里云倍速转码技术依托于强大的云计算基础能力,大幅度提升转码速度,非常适用于音视频网站、新闻资讯、热门影视剧首发等多种场景。
4066 0
|
存储 编解码 对象存储
【转码系列之二】如何快速使用阿里云媒体转码服务和媒体库?
今天来给大家介绍一下如何快速使用阿里云媒体转码服务和媒体库。
7457 0
|
编解码
【转码系列之一】利用阿里云进行媒体转码,你得先知道这些
阿里云媒体转码(Media Transcoding) 是为多媒体数据提供的转码计算服务。它以经济、易用、弹性和高可扩展的音视频转换方法,帮助您将存储于OSS的音视频转码成适合在PC、TV以及移动终端上播放的格式。
6365 0
|
编解码 数据安全/隐私保护
阿里云媒体转码技术
媒体转码承载着终端客户视频观看体验的极致追求,媒体转码技术的增强势必会成为载体。
3392 0
|
3月前
|
编解码 文字识别 API
视觉智能开放平台产品使用合集之是否支持视频和字幕同步
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。

热门文章

最新文章

下一篇
无影云桌面