走进多媒体、模拟信号的数字化 | 学习笔记

简介: 快速学习走进多媒体、模拟信号的数字化,介绍了走进多媒体、模拟信号的数字化系统机制, 以及在实际应用过程中如何使用。

开发者学堂课程【高校精品课-华中科技大学 -智能媒体计算走进多媒体、模拟信号的数字化】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/811/detail/15666


走进多媒体、模拟信号的数字化


内容介绍:

一、多媒体

二、数字信号与系统

三、信噪比

四、信号量化噪声比


一、多媒体( Multimedia )

1、定义:

从字面上看来讲,就是它不只是一种媒体。Multiple 就是多个的意思

⑴融合两种或者两种以上媒体的一种人-机交互式信息交流和传播媒体。

融合媒体形式:文字图形图像声音动画和电视图像

例如一出生睁开双眼看到的就是五彩斑斓的世界,听到了父母亲的声音,这是声音的这种格式。长大开始认字,那就是文字了,看动画片,这是动画。看电视,这视频。比如说画个圆曲线的话,这都是图形方面。

这里面的多媒体指多种的媒体形式在计算机里面怎么对他进行处理

2、特点:

由于是多种媒体的融合在一起因此这个媒体形式它具有这样的特点

⑴集成性、实时性(例如动画、视频直播、新闻、比赛)、交互性(例如游戏)

数字化(现在的多媒体信号为数字信号)

网页超文本文件为多媒体融合提供条件,尤其是 HTML5出来以后编辑一个非常漂亮的这种多媒体形式的网页就变得十分容易。

微信公众号文字图像图形视频融合在一个文件里形成一个整体的内容展现,为整个的这种多媒体形式的多媒体教学提供了很好的方便。

很典型的一个例子是现在的这个政治学习的软件学习强国。那里面其实有关整个党的这种新闻、总书记的讲话、党史资料,老电影。革命歌曲等等全在里面。有了这么一个学习的平台基本上可以把各种资料整合在了一起,也是现在主流的叫做媒体融合。

媒体融合的技术基础就是多媒体的技术。

image.png

 

二、数字信号与系统

1、多媒体信号目前都是以数字的形式存在的。但实际上自然界的任何一种信号,它都是以模拟信号存在的。模拟信号要进到数字系统里面去,那么就要进行模拟信号和数字信号的转换。

2、数字系统的定义:  

数字系统是一个能对数字信号进行加工、传递、和存储的实体,它由实现各种功能的数字逻辑电路相互连接而成。

例如:智能手机、数字计算机、MP3、洗衣机空调控制面板、电视机都是数字系统,但复杂程度不同。实际上智能手机本身已经是一台数字计算机了,因此数字计算机的很多特点在智能手机里面也是有的,因此它是一个很复杂的也是非常非常典型的数字系统。

3、模拟信号与数字信号的相互转换

⑴ A/D -模数转换( Analog-Digital ):模拟信号变成数字信号

D/A -模数转换( Digital-Analog ):数字信号还原到模拟信号

模拟信号:模拟信号是一个连续的波形,如何对它进行数字化?

image.png

时间维度上对曲线进行采样采样是每隔一定的时间间隔采集一个点

image.png

采样间隔越小采集到的点越多对这个曲线描述越精细

//奈奎斯特采样定理采样间隔即采样频率只有高于原始信号的频率两倍的时候才能不失真还原原始信号;如果低于两倍的频率,得越多失真就越多//

通过这样的采样间隔将原本连续的线变成离散的点,将这些离散的点,存到计算机里面变成01的组合在垂直坐标上将其进行了离散,这就是量化。

量化就像在垂直坐标上加很多水平线,将其分为格子,格子越多,描述差别越小。画八条线,描述8个数,从0~7的话,需要三位。将曲线幅度变化分为八个等级即011-111

image.png

观察红色的采样点是否都在线上,可知:很多点不在,有的差别还很大。若采样点不在线上,四舍五入,要么靠上,要么靠下,离哪个近靠哪一级。这时发现线画的太稀疏,误差大。

继续细化,变为16个格子,将线加密,原来不在线上的点在线上了,原来离线很远的点现在已经接近了。将线加密后,离散点接近线,采样点的值描述精度进一步提高,从8变为16,二进制位数变为四位即0110-1101。再继续加线的话,描述的精度指标会越来越高。

image.png

总结:

模拟信号进行数字化需要采样。

①采样:每隔一定的时间间隔采取一个点

采样频率:根据奈奎斯特的采样定理采样频率不低于模拟信号最高频率的两倍这样就可以不失真还原成原来的模拟信号

量化把信号幅度划分成若干小段每段都是相等的,就是一个均匀的量化,称为线性量化;否则称为非线性量化。

量化取决于用二进制这个数的位数。

④量化精度:用样本值的二进制位数来表示,位数越多精度越高,数据也越大。量化精度取决于二进制的位数。

无论是声音图像还是视频都是通过这种方式进行模拟信号到数字信号转换的。不同的是声音它是个二维的,就是在时间轴上去把波形采样出来。而图像是个二维的要把空间的点把它采集下来,并且进行量化。而动画或者视频它除了空间,还有时间的维度。三维动画,

是三维视频,那么维度就继续加大


三、信噪比 ( SNR S/N ): Signal to Noise Radio

1、描述一个信号的质量好坏的时候通常是用信噪比。在模拟信号里面或在数字信号里面,都有信噪比的概念。

⑴定义:指一个电子设备或者电子系统中信号与噪声的比值

信号:来自设备外部需要通过设备进行处理的电子信号。

噪声:指经过设备后产生的原信号中并不存在的无规则额外信号或信息

噪声信号不随原信号的变化而变化,与原信号无关,与信号的失真不同,它是无规律的,比如采样由于精度不够,就是采样点间隔太大了。这引起的失真它是有规律的,它跟原始型号是有联系的。

⑵单位:分贝( dB )

2、计算公式:

image.png

P 指功率或能量,Ps 指信号功率,Pn 指噪声的功率

由于功率和电压成平方正比,所以可用电压取代功率,电压的平方可以把它变换到前面来:

image.png

信噪比是与质量成正比的,或者是信号的质量与信噪比成正比。信噪比越大,信号质量越好,相反噪声越小,信噪比值越大。这个值越大,信号的质量就越高。

 

四、信号量化噪声比

1、把一个模拟信号变换成了这个数字信号以后,在哪里可以产生噪声?

在量化的过程里,由于采样点的值很少有恰好在线上,不在线上的这个点需四舍五入取整,要靠离它最近的值,在这个过程里面产生了误差,这个误差叫量化噪声。

image.png

2、量化噪声,取的名字叫信号量化噪声比,既然有噪声,怎么描述这个信号量化之后的信号的质量?

在有噪声的情景中,描述信号量化之后的信号质量,将信噪比的概念引入,由于是在量化过程中产生的噪声,就用信号与量化噪声的比即( SQNR )( Signal to Quantization Noise Radio )表示质量。

有三位是8种组合(0-7),这个绿圈的值它最大的误差实际上是这个格子的1/2。取这个这个点在两条线中间的时候,就是离上下两条线一样高的时候,差值是最大的,也就是等于1/2。

image.png

计算方法:( N 为量化位数)

将数值代入,推导可得 SQNR 所得值

image.png

⑵从这个公式上来看 SQNR 与量化的精度就是二进制的位数n是成正比,量化位数越高, SQNR 越大,质量越高。

每增加一位, SQNR 增加6 dB

16位达到96 dB

提高量化精度可以提高信噪比,就可以提高信号整体质量。

后面的课就会分别从声音图像动画视频不同的媒体形式来介绍如何对这些模拟信号进行数字化以及它们本身所涉及到的一些基本的概念

相关文章
|
网络协议 jenkins 调度
Docker【部署 06】Swarm实践及Operation not permitted和No chain/target/match by that name问题处理
Docker【部署 06】Swarm实践及Operation not permitted和No chain/target/match by that name问题处理
1089 0
Docker【部署 06】Swarm实践及Operation not permitted和No chain/target/match by that name问题处理
|
3月前
|
人工智能 监控 API
Anthropic 的 API 围城:第三方工具的生存指南
1月中旬,Anthropic限制Claude Pro订阅凭证仅限官方应用使用,第三方工具(如Moltbot、OpenCode)因OAuth token含`scope: "claude-code-only"`被拒。此举源于成本压力、滥用风险与生态控制。用户可选API付费、切换OpenAI/本地模型或等待传闻中的开发者订阅。行业“蜜月期”正结束。
1099 3
|
4月前
|
安全 Java API
Java日期处理完全指南(新手也能轻松掌握的Java时间格式化与日期API教程)
教程来源https://www.vpshk.cn/本文介绍Java 8引入的java.time包,详解LocalDateTime、LocalDate等类的使用,涵盖获取当前时间、格式化、解析字符串及日期运算,助你轻松掌握现代Java日期处理方法,适合初学者快速上手。
|
存储 缓存 安全
在 Service Worker 中配置缓存策略
Service Worker 是一种可编程的网络代理,允许开发者控制网页如何加载资源。通过在 Service Worker 中配置缓存策略,可以优化应用性能,减少加载时间,提升用户体验。此策略涉及缓存的存储、更新和检索机制。
|
人工智能 物联网 数据库
GoT:基于思维链的语义-空间推理框架为视觉生成注入思维能力
本文探讨GoT框架如何通过语义-空间思维链方法提升图像生成的精确性与一致性。GoT(Generative Thoughts of Thinking)是一种创新架构,将显式推理机制引入图像生成与编辑领域。它通过语义推理分解文本提示,空间推理分配精确坐标,实现类人的场景构思过程。结合大型语言模型和扩散模型,GoT在复杂场景生成中表现出色,克服传统模型局限。其专用数据集包含900万样本,支持深度推理训练。技术架构融合语义-空间指导模块,确保生成图像高质量。GoT为图像生成与编辑带来技术革新,广泛应用于内容创作与教育工具开发等领域。
291 4
GoT:基于思维链的语义-空间推理框架为视觉生成注入思维能力
|
存储 人工智能 算法
什么是 FPGA 异构计算|学习笔记
快速学习什么是 FPGA 异构计算
1057 0
什么是 FPGA 异构计算|学习笔记
|
SQL 人工智能 自然语言处理
PolarDB-PG AI最佳实践 1:基础能力实践
Polar_AI 是 PolarDB 数据库的 AI 扩展,集成了先进的人工智能模型和算法,使数据库能够执行机器学习和自然语言处理任务。它支持 PostgreSQL 及 Oracle 兼容版本,通过标准 SQL 轻松调用 AI 模型,具备简单易用、灵活可定制、无缝数据融合、数据安全和高性能等优势。用户可以通过 SQL 快速实现文本转向量、情感分类等功能,并能自定义扩展 AI 模型。
|
存储 固态存储 Java
文件系统使用固态硬盘(SSD)
【10月更文挑战第8天】
602 2
|
前端开发 JavaScript 关系型数据库
深入理解单体架构
深入理解单体架构
611 0
FunASR离线文件转写软件包3.0问题之wfst热词增强对于热词构图如何解决
FunASR离线文件转写软件包3.0问题之wfst热词增强对于热词构图如何解决
340 0