空间音频是什么?

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 从单声道音频发展到双声道、再到多声道和环绕立体声,数字音频的表现力不断提升。空间音频(也称为三维声音或3D音频)并不只是通过增加声道来创造立体感,而是一种与视频空间化同步的音频处理过程。基于空间的音频甚至可以具有六个自由度,使用户能够互动。声音不仅要清晰动听,还要与空间场景完美契合,带来沉浸式体验。让我们一起深入了解一下空间音频技术。

空间音频技术

空间音频技术,用于提供声音的立体感和定位感。 典型的格式包括5.1声道和7.1声道。

这项技术通常用于电影、音乐、游戏等内容制作,以提供更加沉浸式的音频体验。

EAC3 5.1

EAC3(Enhanced AC-3):EAC3,也称为Dolby Digital Plus,是由杜比实验室开发的音频编解码器。
通常情况下,EAC3支持环绕声,而“5.1”代表5个扬声器通道(左前、中前、右前、左后、右后)和1个低音效(低音炮)。

DTS 7.1

DTS(Digital Theater Systems):DTS用于电影和音乐等数字音频编解码器和环绕声系统。
“7.1”指的是7个扬声器通道,通常包括前左、前中、前右、后左、后右、环绕左、环绕右,以及1个低音效(低音炮)。

screenshot-20240407-171039.png
*图片来源:https://ja.unifab.ai/

空间音频应用

空间音频的应用正在变得更加普及,随着空间音频耳机的支持逐渐普及,人们体验空间音频的门槛也在迅速降低。随着空间音频用户规模的增长,传统立体声音频产生了巨大的冲击。

在音乐领域,苹果公司推出了专业音乐制作工具Logic Pro,内置了Dolby Atmos制作环境。

2021年,苹果在Apple Music上推出了周杰伦地表最强世界巡回演唱会的Dolby全景声版。这张专辑利用了Dolby全景声技术来提升音效,并支持苹果在iOS 15上的动态头部追踪技术。通过动态调整声音,当您转动头部时,环绕您的空间音频将随着您的头部重新定位,带来更加身临其境的音乐体验。

在电影领域,Hans Zimmer一直致力于将最新技术应用到电影音乐制作中。他在《狮子王》、《盗梦空间》、《星际穿越》和《沙丘》等作品中运用了Dolby Atmos的空间音频技术,重新制作了《沙丘》电影原声带,让更多人体验到完整沉浸式的音乐体验。

在游戏中,混合现实体验的成功在于让玩家身临其境,仿佛虚拟场景真实发生在他们身上。例如,基于微软HoloLens的MR游戏RoboRaid场景,让玩家真实感受自己置身于客厅中抵抗外星机器人的入侵。空间音频配合视觉效果可以大大提升这种真实感。

相关文章
|
1天前
|
人工智能 测试技术 异构计算
TangoFlux:高速生成高质量音频,仅用3.7秒生成长达30秒的音频,支持文本到音频转换
TangoFlux 是由英伟达与新加坡科技设计大学联合开发的文本到音频生成模型,能够在3.7秒内生成30秒的高质量音频,支持文本到音频的直接转换和用户偏好优化。
24 5
TangoFlux:高速生成高质量音频,仅用3.7秒生成长达30秒的音频,支持文本到音频转换
|
3月前
|
JavaScript
ThreeJs的音频和位置音频
这篇文章详细介绍了在Three.js中如何使用Audio和PositionalAudio来实现普通音频和位置相关的音频效果,包括音频加载、音量控制以及如何根据位置变化调整音频的播放。
34 1
|
7月前
|
人工智能 自然语言处理 机器人
字节打造大模型TTS:不仅能高保真合成,而且支持调整编辑
【6月更文挑战第26天】字节跳动的Seed-TTS是先进的文本转语音系统,生成与人类语音难辨别的声音,并允许编辑。模型通过语音、文本编码器、解码器和声码器实现高保真、可控及多样化的语音生成。应用于智能客服、有声读物、导航,提升用户体验。虽在多模态任务、长文本生成、实时应用及隐私问题上面临挑战[[arxiv.org/pdf/2406.02430](https://arxiv.org/pdf/2406.02430)]。
138 7
|
7月前
|
Java Linux
ffmpeg音频格式转换、合成、速率调整
ffmpeg音频格式转换、合成、速率调整
132 2
|
机器学习/深度学习 传感器 算法
【视频处理】通过调用图像来重建新影片及计算颜色通道的平均灰度值,并检测帧与前一帧之间的差异(Matlab代码实现)
【视频处理】通过调用图像来重建新影片及计算颜色通道的平均灰度值,并检测帧与前一帧之间的差异(Matlab代码实现)
|
存储 编解码 缓存
libfdk_aac音频采样数和编码字节数注意
libfdk_aac音频采样数和编码字节数注意
191 0
|
存储 编解码 Java
【Android FFMPEG 开发】FFMPEG 音频重采样 ( 初始化音频重采样上下文 SwrContext | 计算音频延迟 | 计算输出样本个数 | 音频重采样 swr_convert )(一)
【Android FFMPEG 开发】FFMPEG 音频重采样 ( 初始化音频重采样上下文 SwrContext | 计算音频延迟 | 计算输出样本个数 | 音频重采样 swr_convert )(一)
761 0
|
编解码 Android开发 数据格式
【Android RTMP】x264 编码器初始化及设置 ( 获取 x264 编码参数 | 编码规格 | 码率 | 帧率 | B帧个数 | 关键帧间隔 | 关键帧解码数据 SPS PPS )(二)
【Android RTMP】x264 编码器初始化及设置 ( 获取 x264 编码参数 | 编码规格 | 码率 | 帧率 | B帧个数 | 关键帧间隔 | 关键帧解码数据 SPS PPS )(二)
411 0
【Android RTMP】x264 编码器初始化及设置 ( 获取 x264 编码参数 | 编码规格 | 码率 | 帧率 | B帧个数 | 关键帧间隔 | 关键帧解码数据 SPS PPS )(二)
|
监控 Android开发 开发者
【Android 高性能音频】AAudio 音频流 缓冲区 简介 ( AAudio 音频流内部缓冲区 | 缓冲区帧容量 | 缓冲区帧大小 | 音频数据读写缓冲区 )
【Android 高性能音频】AAudio 音频流 缓冲区 简介 ( AAudio 音频流内部缓冲区 | 缓冲区帧容量 | 缓冲区帧大小 | 音频数据读写缓冲区 )
506 0
【Android 高性能音频】AAudio 音频流 缓冲区 简介 ( AAudio 音频流内部缓冲区 | 缓冲区帧容量 | 缓冲区帧大小 | 音频数据读写缓冲区 )
|
存储 SQL 关系型数据库
多进程截取海康相机视频帧存储
多进程截取海康相机视频帧存储
303 0