倍频程与钢琴调式的距离-阿里云开发者社区

开发者社区> 阿里云视频云> 正文
登录阅读全文

倍频程与钢琴调式的距离

简介: 单从倍频程和钢琴调式这两个名词看,距离确实有点远,一个偏科技一个偏娱乐。但是距离远不代表没有关系,下面就让我们给它们俩拉拉关系吧。

作者:良逸
来源:倍频程与钢琴调式的距离

什么是倍频程

首先什么是倍频程?从中文字义上看,就是 “X 倍频率的范围”,是截至频率和起始频率之比成倍数关系的频段。与之相对应的另一个概念是等宽频程,意思是截止频率和起始频率之差相等的频段。具体定义如下:
image.png

image.png

为什么要用倍频程?

我们知道人耳的听觉的频率感知范围在 20Hz-20000Hz,范围非常的广,分析的时候,需要将这个频率范围划分成不同的频段(频带)来分析,怎么划分呢?于是有了上文的两种划分方式,一种是等宽频程,意味着每个划分的频带宽度是相等的;另一种是倍频程,意味着每个划分的频带宽度与上一个紧邻的频带宽度符合等比数列。

如果采用等宽频程,要表现出低频到高频的声音信息需要的数据量非常大,效率比较低,而且人耳对高低频率的敏感程度是不一样的,通常人耳对低频部分的频率变化比较敏感,而对高频部分的频率变化不太敏感,所以采用倍频程更符合人耳的听力特点,而且提高了频带数据的分析效率。

image.png
image.png

图片数据来源:https://community.sw.siemens.com/s/article/octaves-in-human-hearing

同一个白噪声表现为窄带(蓝色)和倍频程(紫色)格式,x 轴是倍频程格式。注意到,与较高频率的倍频程段相比,较低频率处的倍频带的填充数据较少。如上表格所示,这是因为较高频率的倍频带覆盖的频率范围,相比较低频率的倍频带要宽。如果将 x 轴线性绘制的话,效果如下图所示(引用网络公开测试结果,数据来源见图片下方):
image.png

图片数据来源:https://community.sw.siemens.com/s/article/octaves-in-human-hearing

与倍频程格式相比,上图绘制了与之前相同的白噪声数据,但 x 轴是线性格式。可以看出,功率谱(蓝色)在所有频率下具有相同的密度,但每个倍频带(紫色)覆盖的频率范围越来越大。

另外,因为选取不同的基准频率,最终展开的频段格式也不一样,那如何来选取基准频率呢?标准化组织根据不同的应用场景就给出了不同的倍频程的标准定义。在声学测量中一般采用 1/3 倍频程来对频谱进行分析,国标《GB 3240-1982 声学测量中的常用频率》中对其标准频率有如下的定义:
image.png

八度音阶

从这里开始我们看一下倍频程跟音乐有什么关系。我们搜索 “倍频程” 英文翻译的时候,会发现如下结果:

image.png

为什么倍频程跟八度音阶都是 Octave 一个词呢?其实倍频程是借用了八度音阶的理论,因为历史上人们对音乐的认知要早于信号频谱分析的理论的掌握。根据人们的经验,音调升高一个八度,频率就增加一倍,近代频谱分析技术出现后,恰好发现这个刚好满足倍频规律。因此就按频率重新定义八度音阶。其实八度音阶在频率这个概念出现前就有了。

我们大家都知道,简谱中的八度音阶是这个样子的:
image.png

低音 do 跟高音 do 之间相差 8 度音,也知道女生一般比男生声音高 8 度。

这里还要说一下音高的概念,音高的英文是 pitch,而 pitch 又翻译成基音,而且 Opus 编码器里面有个功能叫 Pitch Detection,翻译成基因检测,那基音跟音高是啥关系呢?物体震动产生的声音,其中包含很多频率成分,最低的那个频率称为基频,对应产生的声音就叫基音,其他的谐波频率成分产生的声音就叫泛音。其中基音决定了人耳听到的声音的音高,而泛音形成了不同的音色,不同乐器有不同的音色,就是因为其产生的泛音成分不一样。与倍频程相关的频率划分,以及与八度音阶相关的音高,都是指的基音的频率,与泛音没有关系。

十二平均律

我们再看一下八度音阶的特点。

image.png

我们会发现 mi 和 fa,及 si 和高音 do 之间是半音关系,其它每个音之间是全音关系。所谓半音关系意味着,半音关系的音高比全音关系的音高少一半。如果把八度音阶,按半音的频宽展开的话,将会产生 12 个半音宽的频带,这就是所谓的十二平均律,又叫十二等程律,现在的钢琴就是根据十二平均律定音的。终于跟钢琴扯上关系了。

我们又知道一个八度音阶,对应的低频和高频相差 1 倍,即一个倍频程,那等程分成 12 份的话,那对应的就是 1/12 倍频程。音乐领域的标准化又来了,下图就是国际标准音高与频率对照表:
image.png

此表规定 A4 的频率 440Hz 作为基准频率,按照 1/12 倍频程的关系将频谱展开,就得到了每个标准钢琴琴键对应的音高频率。同样钢琴上的中央 C,对应的就是 C4 的键 261.63Hz。

image.png

音名和唱名

我们看到八度音阶是 1234567(do re mi fa sol la si),而这里又出现了 CDEFGAB,学过音乐的人都知道,一个是唱名一个是音名。唱名是演唱用的,而音名则是与固定频率或音高挂钩的,不同的是,同一个唱名可以放在不同的音名上,可以在钢琴琴键上左右移动,但是不同的音名则是与固定频率挂钩,是不会移动的。

钢琴调式

有了全音、半音、音名、唱名,以及唱名可以在琴键上移动,就产生了调式。

首先,全音和半音的关系,决定了是大调还是小调。凡是音阶排列符合【全、全、半、全、全、全、半】结构的音阶,就是大调。一般来说,一首音乐作品的主音符是使用 1、3、5 的,而结束在 1 上的就是大调音乐。
image.png

凡是音阶符合【全、半、全、全、半、全、全】结构的音阶,就是小调。小调音乐一般第一个音符是从 6 或 3 开始,而结束在 6 上。
image.png

当然大小调还按照不同的变音规则有很多其他细分,这里就不深究了。

其次,又因为唱名可以在琴键上移动,当主音符的 do 移动到 C 上,这时的大调就称做 C 大调,同理,当主音符的 do 移动到 D 上,这时的大调就称做 D 大调,而小调,也是这么定义的。

到此,终于给这两个看似不相关的名词拉上关系了,是不是还有点意思?

「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。

image.png

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:

分享视频云行业和技术趋势,打造“新内容”、“新交互”。

官方博客
官网链接