音频文件常用格式

简介: 笔记

一、前言


 在复习备考《多媒体技术》时整理的多媒体技术音频文件的常用格式。本文完全足以应对《多媒体技术》中音频的相关考点后续还有一份多媒体技术相关的文档整理会传上来。

1.jpeg


二、音频文件格式


1、MP3

 MP3是计算机、手机、MP3设备、随身数码设备(iPod)等常用的音频文件格式。MP3是一种音频压缩技术,其全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III),简称为MP3。使用此格式来存储的音频文件,可以大幅度地降低音频数据量,并提供了较好的音质效果。

 MP3格式文件是一种有损的音频压缩(文件编码)格式,但是它的优点是,文件容量较小,方便存储携带传播,尤其是网络收听,或者存储在手机,用来播放MP3音乐。


2、WAV

 简称WaveForm,WAV是其缩写,也称为波形文件,可直接存储声音波形,在Windows系统中,WAV格式音频文件较为常见。它是微软公司专门为Windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真。

 但是WAV有一个非常大的缺点,文件占用的磁空间非常的大,但是,WAV文件还原的波形曲线十分逼真,音质也非常好。


3、WMA

 简称WMA(全称Windows Media Audio),它是微软公司推出的一种音频文件格式。WMA在压缩比和音质方面都有着出色的表现,可以媲美MP3文件,在较低的采样频率下也能产生较好的音质。

 WMA也属于有损的音频文件压缩格式,但是因为其文件占用磁盘空间少,较为方便和传播,也深受用户喜爱。


4、FLAC

 FLAC属于无损失音频文件压缩格式,使用此编码的音频数据几乎没有任何信息损失。FLAC全称Free Lossless Audio Codec,中文名为无损音频压缩编码,该文件占用空间较大,适合存储于计算机,或者大容量手机之中,适合音乐发烧友用户使用。

 PS:用较为高端的耳机、声卡监听(播放)此音频格式文件,可以听到非常逼真、生动的音乐,高音低音表现“清澈透亮”、“浑厚大气”,与CD播放机播放出来的音乐几乎无差异。


5、MIDI

 MIDI是一种编曲类的音频格式文件,全称为Musical Instrument Digital Interface,即乐器数字接口。是编曲界最广泛的音乐标准格式,可称为“计算机能理解的乐谱”。它用音符的数字控制信号来记录音乐,一首完整的MIDI音乐只有几KB或者几十KB大小,而能包含数十条音乐轨道。

 我们听MIDI音乐的时候,它都是音乐(乐谱)的声音,而没有人声。它主要的作用是辅助音乐创作、乐曲演奏等。


6、RA

 RA文件是RealAudio音频格式文件的简称,它是一种可以在网络上实时传送和播放的音乐文件的音频格式的流媒体技术。RA文件压缩比例高,失真也较为严重,但是可以随网络带宽的不同而改变声音质量(比特率)。

 此文件现在并不常用,而在十几年前低带宽(拨号上网)的网络环境下,并且适合在网络传输速度较低的互联网上使用。


7、APE

 APE是一种数字无损音频文件压缩格式。我们可以利用Monkey’s Audio这个软件,将庞大的WAV音频文件压缩为APE,体积虽然变小了,但音质和原来一样。

 APE文件也可以提供非常好的音质还原,其占用的磁盘空间也相对较小。


8、AAC

 AAC文件全称Advanced Audio Coding,被称为高级音频编码。AAC文件也是属于一种有损压缩格式,但是与MP3不同的是,它采用了全新的算法进行编码,利用AAC编码,可使人感觉声音质量没有明显降低的前提下,文件更小。

 虽然它可以提供更好的音质,但是其效果还是不可以与APE和FLAC等格式文件相比。


9、CDA

 喜欢用CD播放机听音乐的同学,对此文件格式一定不会陌生。十几年前流行的WalkMan CD播放机,播放出来的音乐,音质是非常的好,有一种“声临其境”的感觉。

 标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是高度还原原声的。


10、MOV

 苹果系统中常用的音频、视频封装格式文件,是QuickTime封装格式。目前,此格式文件也在Windows中也较为常用,多数手机和系统,可以直接播放该格式文件。


三、总结


 以上为常见的音频文件格式,对于音乐制作、vlog制作、有声书作者来说,高码流高音质的音频非常重要,在不同的环境下,选择不同的音频压缩(编码)标准,既方便传播,也可以给用户提供更加优秀的音频播放效果,获得更好的展现效果。


相关文章
|
存储 编解码 算法
音视频之音频知识入门
信息论的观点来看,描述信源的数据是信息和数据冗余之和,即:数据=信息+数据冗余。音频信号在时域和频域上具有相关性,也即存在数据冗余。将音频作为一个信源,音频编码的实质是减少音频中的冗余。自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
1743 0
|
机器学习/深度学习 编解码 语音技术
音频基础知识 2
音频基础知识
1042 0
|
敏捷开发 人工智能 前端开发
让你爽到飞起的【懒人插件AutoScssStruct4Vue】VSCode根据template的标签目录自动一键生成CSS/SCSS/LESS结构,敏捷开发必备插件!!!
让你爽到飞起的【懒人插件AutoScssStruct4Vue】VSCode根据template的标签目录自动一键生成CSS/SCSS/LESS结构,敏捷开发必备插件!!!
R语言分布滞后线性和非线性模型DLM和DLNM建模应用| 系列文章
R语言分布滞后线性和非线性模型DLM和DLNM建模应用| 系列文章
|
8月前
|
存储 Linux 内存技术
linux系统查看硬盘序列号
本文介绍在Linux系统中查看硬盘信息的三种方法:1) 使用`hdparm`工具,通过`sudo hdparm -i /dev/sda`获取硬盘序列号和型号;2) 使用`smartctl`工具,不仅可查序列号和型号,还能了解硬盘健康状态;3) 使用`lshw`命令显示存储设备拓扑信息。此外,提供通用技巧如用`lsblk`确认磁盘标识,及注意事项,例如管理员权限和云主机可能隐藏物理序列号等。
|
机器学习/深度学习 存储 编解码
Tiny Time Mixers (TTM)轻量级时间序列基础模型:无需注意力机制,并且在零样本预测方面表现出色
IBM研究人员提出Tiny Time Mixers (TTM),这是一个轻量级、基于mlp的TS模型,参数量小于1M,在M4数据集上表现优于大型SOTA模型,且具备优秀的零样本预测能力。TTM无注意力机制,利用TSMixer进行多级建模,自适应补丁和频率前缀调整等创新特性提升性能。预训练和微调阶段各有独特设计,预训练仅用单变量序列,微调时学习多变量依赖。TTM在某些任务中证明了小模型的优越性,且模型已开源。
995 1
|
程序员 数据库 微服务
长事务管理不再难:Saga模式全面解析
本文介绍了分布式事务中的Saga模式,它用于解决微服务架构下的事务管理问题。Saga通过一系列本地事务和补偿操作确保最终一致性,分为编排和协同两种模式。文章重点讲解了编排模式,其中 Saga 协调者负责事务的执行和失败后的补偿。Saga 模式适用于业务流程明确且需要严格补偿的场景,能有效管理长事务,但实现上可能增加复杂性,并存在一致性延迟。文章还讨论了其优缺点和适用场景,强调了在面对分布式事务挑战时,Saga 模式的价值和潜力。
2966 6
|
11月前
|
人工智能 安全 网络虚拟化
指南:Grok官网是什么?国内如何使用grok 3 官网AI
Grok AI 是一款非常强大的人工智能助手,不仅能够在社交媒体管理、语音助手等方面为用户提供便利,还可以极大提升工作效率。
6910 5
|
架构师 Java 测试技术
一文搞透高并发指标(QPS、TPS、吞吐量等)
详解高并发场景下的QPS、TPS、RT及吞吐量等关键性能指标,帮助理解系统性能评估的核心概念。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
一文搞透高并发指标(QPS、TPS、吞吐量等)
|
机器学习/深度学习 人工智能 开发者
【AI系统】昇思 MindSpore 关键特性
本文介绍华为自研AI框架昇思MindSpore,一个面向全场景的AI计算框架,旨在提供统一、高效、安全的平台,支持AI算法研究与生产部署。文章详细阐述了MindSpore的定位、架构、特性及在端边云全场景下的应用优势,强调其动静态图统一、联邦学习支持及高性能优化等亮点。
540 7
【AI系统】昇思 MindSpore 关键特性

热门文章

最新文章