空间音频是什么?

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
实时计算 Flink 版,5000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 从单声道音频发展到双声道、再到多声道和环绕立体声,数字音频的表现力不断提升。空间音频(也称为三维声音或3D音频)并不只是通过增加声道来创造立体感,而是一种与视频空间化同步的音频处理过程。基于空间的音频甚至可以具有六个自由度,使用户能够互动。声音不仅要清晰动听,还要与空间场景完美契合,带来沉浸式体验。让我们一起深入了解一下空间音频技术。

空间音频技术

空间音频技术,用于提供声音的立体感和定位感。 典型的格式包括5.1声道和7.1声道。

这项技术通常用于电影、音乐、游戏等内容制作,以提供更加沉浸式的音频体验。

EAC3 5.1

EAC3(Enhanced AC-3):EAC3,也称为Dolby Digital Plus,是由杜比实验室开发的音频编解码器。
通常情况下,EAC3支持环绕声,而“5.1”代表5个扬声器通道(左前、中前、右前、左后、右后)和1个低音效(低音炮)。

DTS 7.1

DTS(Digital Theater Systems):DTS用于电影和音乐等数字音频编解码器和环绕声系统。
“7.1”指的是7个扬声器通道,通常包括前左、前中、前右、后左、后右、环绕左、环绕右,以及1个低音效(低音炮)。

screenshot-20240407-171039.png
*图片来源:https://ja.unifab.ai/

空间音频应用

空间音频的应用正在变得更加普及,随着空间音频耳机的支持逐渐普及,人们体验空间音频的门槛也在迅速降低。随着空间音频用户规模的增长,传统立体声音频产生了巨大的冲击。

在音乐领域,苹果公司推出了专业音乐制作工具Logic Pro,内置了Dolby Atmos制作环境。

2021年,苹果在Apple Music上推出了周杰伦地表最强世界巡回演唱会的Dolby全景声版。这张专辑利用了Dolby全景声技术来提升音效,并支持苹果在iOS 15上的动态头部追踪技术。通过动态调整声音,当您转动头部时,环绕您的空间音频将随着您的头部重新定位,带来更加身临其境的音乐体验。

在电影领域,Hans Zimmer一直致力于将最新技术应用到电影音乐制作中。他在《狮子王》、《盗梦空间》、《星际穿越》和《沙丘》等作品中运用了Dolby Atmos的空间音频技术,重新制作了《沙丘》电影原声带,让更多人体验到完整沉浸式的音乐体验。

在游戏中,混合现实体验的成功在于让玩家身临其境,仿佛虚拟场景真实发生在他们身上。例如,基于微软HoloLens的MR游戏RoboRaid场景,让玩家真实感受自己置身于客厅中抵抗外星机器人的入侵。空间音频配合视觉效果可以大大提升这种真实感。

相关文章
|
4月前
|
编解码 语音技术 内存技术
FFmpeg开发笔记(五十八)把32位采样的MP3转换为16位的PCM音频
《FFmpeg开发实战:从零基础到短视频上线》一书中的“5.1.2 把音频流保存为PCM文件”章节介绍了将媒体文件中的音频流转换为原始PCM音频的方法。示例代码直接保存解码后的PCM数据,保留了原始音频的采样频率、声道数量和采样位数。但在实际应用中,有时需要特定规格的PCM音频。例如,某些语音识别引擎仅接受16位PCM数据,而标准MP3音频通常采用32位采样,因此需将32位MP3音频转换为16位PCM音频。
126 0
FFmpeg开发笔记(五十八)把32位采样的MP3转换为16位的PCM音频
|
1月前
|
人工智能 数据处理
LatentSync:根据音频生成高分辨率、动态逼真的唇形同步视频
LatentSync 是由字节跳动与北京交通大学联合推出的端到端唇形同步框架,基于音频条件的潜在扩散模型,能够生成高分辨率、动态逼真的唇同步视频,适用于影视、教育、广告等多个领域。
223 19
LatentSync:根据音频生成高分辨率、动态逼真的唇形同步视频
|
1月前
|
人工智能 测试技术 异构计算
TangoFlux:高速生成高质量音频,仅用3.7秒生成长达30秒的音频,支持文本到音频转换
TangoFlux 是由英伟达与新加坡科技设计大学联合开发的文本到音频生成模型,能够在3.7秒内生成30秒的高质量音频,支持文本到音频的直接转换和用户偏好优化。
98 6
TangoFlux:高速生成高质量音频,仅用3.7秒生成长达30秒的音频,支持文本到音频转换
|
4月前
|
JavaScript
ThreeJs的音频和位置音频
这篇文章详细介绍了在Three.js中如何使用Audio和PositionalAudio来实现普通音频和位置相关的音频效果,包括音频加载、音量控制以及如何根据位置变化调整音频的播放。
54 1
|
8月前
|
Java Linux
ffmpeg音频格式转换、合成、速率调整
ffmpeg音频格式转换、合成、速率调整
157 2
|
存储 编解码 缓存
libfdk_aac音频采样数和编码字节数注意
libfdk_aac音频采样数和编码字节数注意
222 0
|
存储 编解码 Java
【Android FFMPEG 开发】FFMPEG 音频重采样 ( 初始化音频重采样上下文 SwrContext | 计算音频延迟 | 计算输出样本个数 | 音频重采样 swr_convert )(一)
【Android FFMPEG 开发】FFMPEG 音频重采样 ( 初始化音频重采样上下文 SwrContext | 计算音频延迟 | 计算输出样本个数 | 音频重采样 swr_convert )(一)
771 0
|
存储 算法 数据可视化
Android 音频(一) | 采样量化编码 & AudioRecord 录制音频
Android 音频(一) | 采样量化编码 & AudioRecord 录制音频
2104 0
|
机器学习/深度学习 自然语言处理 数据可视化
从视频到音频:使用VIT进行音频分类
在本文中,我们将利用ViT - Vision Transformer的是一个Pytorch实现在音频分类数据集GTZAN数据集-音乐类型分类上训练它。
296 0
从视频到音频:使用VIT进行音频分类
|
计算机视觉
使用跳帧解码解决视频流或高帧视频处理缓慢过程
使用跳帧解码解决视频流或高帧视频处理缓慢过程
1183 0