开发者学堂课程【高校精品课-华中科技大学 -智能媒体计算:数字音频基础(中)】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/811/detail/15668
数字音频基础(中)
内容介绍:
一、声音数字化
二、声音文件
三、数据量与文件
一、 声音数字化
在了解到如何来描述声音以及影响声音质量的因素之后,那声音的数字化,也就是由一个模拟信号变成数字信号是如何实现的。第一讲中说过,模拟信号要变成数字信号要经过两个过程,采样和量化。
1. 采样
在时间的维度上对模拟信号采样(即在图上画的垂直的线),每隔一个时间间隔采集一个点,这个点越密集还原的原始声音就越精确。这个要遵循采样定理,即大于模拟信号的最高频率的两倍进行采样。
2. 量化
在振幅维度上对模拟信号(即在图上画的水平的线)进行数字化、离散化,水平的线画的越密集就越精确,但是越密集所需要的位数就越高。
3.采样频率
(1)通常有11.025 kHz, 22.05 kHz 和44.10kHz
(2)最常用的为44.10 kHz 。那为什么最常用的是44.10 kHz 或者说声音用什么样的采样频率才好。44.10 kHz 的质量最好,因为按照采样定理是指对大于原始信号的两倍进行采样,而人能听到的音频的最高频率是20000 Hz。而20000Hz 乘以2就是40 kHz ,又因为44.10 kHz大于20 kHz,所以可以无失真的还原音频信号,故选择44.10 kHz。因此,知道了音频范围和采样定理就知道应该采用什么样的采样频率来还原原始信号。
(3)采样频率越高,声音失真越小,但是样本的量提高了,所以音频数据量越大
4.量化精度
(1)通常采用8位、12位和16位等
(2)位数越高,声音的质量越好,需要存储的空间越多;位数越少,声音的质量越差,需要储存的空间越少
5.影响声音质量的因素
(1)采样的频率
(2)量化精度:也就是需要多少
(3)声道个数
二、 声音文件大小的计算
所有的信号都是可以计算的,而数字信号就是变成数字以后的信号,学这门课程一定要学会计算信号。
WAV 文件/波形文件
1.含义:把每一个采样点按照时间顺序储存下来,一个采样用多少位数,一个点挨着一个点的储存下来,通过这些点可以恢复形成波形图谱。
2. WAV 文件的存储量等于采样频率也就是每秒钟多少个点乘以量化位数再乘以声道的个数这里出来的是位,如果问每秒钟需要多少个字节就需要在除以8
WAV 文件每秒的储存量(字节)=采样频率(Hz) *量化位数 *声道数∕8
例题:数字激光唱盘 (CD—DA) 的标准采样频率为44.10 kHz, 量化位数16位,立体声。一分钟 CD—DA 音乐所需的储存量为多少?
解答:44.10乘以1000,准确来说也可以乘以1024;再乘以16是量化的精度;再乘以2是双声道;一分钟是60秒,再乘以60;再除以8;最后算出来的就是需要的字节。
(44.10*1000*16*60/8)=10584000(字节)
光盘里能够储存多少首歌,取决于每首歌的长度;如果一首歌的时间长了那储存的歌的个数就变少了。如果存在 MP3 就是另外一回事, MP3 是经过压缩之后的,是取决于原始的声音可压缩的程度。就像海绵里的水一样,如果海绵里原始的水很多,那么压出去的水就多;如果原来海绵很硬没有水,那可压缩的东西就很少。
三、数据量与文件
由表可以看出,第一列是采样频率,第二列是数据长度也就是采样精度,而随着采样频率和量化位数的提升,数据量也在提升的,但是它的质量也在提升。
采样频率 Hz |
数据长度 bit |
数据量/分钟 |
音质评价 |
11025 |
8 |
0.66 MB |
低 |
22050 |
8 |
1.32 MB |
一般 |
44100 |
8 |
2.46 MB |
良好 |
11025 |
16 |
1.32 MB |
中 |
22050 |
16 |
2.64 MB |
良好 |
44100 |
16 |
5.29 MB |
优秀 |