Instagram:如何提升音乐音频质量?

简介: Ins tagram始终以高质量的体验为目标开发和优化应用程序,而优化Instagram体验的其中一种方式就是提高音频质量。

文 / Chris Hsu


译 / 蒋默邱泽


原文


https://instagram-engineering.com/improving-instagrams-music-audio-quality-284e555102e9


Instagram在形成有意义的社区方面起着至关重要的作用,这是因为人们可以在Instagram上相互联系彼此并分享对他们来说最感兴趣的事情。为了帮助更好地促进这些联系,我们始终以高质量的共享体验为目标来开发和优化应用程序。这让我们引以为豪:)优化Instagram体验的其中一个方法就是提高音频质量。


image.png

Instagram的音乐贴歌单给出流行音乐建议


什么是音频质量?


音频质量就是衡量我们提供给Instagram App的音频与原始未经过压缩的音频的匹配程度,一般情况下Instagram提供压缩后的音频,可实现音乐、视频的流畅播放,减少缓冲造成的停顿。


但是为了实现更流畅的播放,可能会带来压缩失真的后果。一些压缩失真的例子:高频声音的清晰度降低、低音减弱以及产生噪音。这些共同的差异同时降低了听众感知的音频质量。


提升音频质量


Instagram的视频系统可以访问多种级别的音频质量,而音频编解码器如何选择采样率和码率会影响到音频编码的质量。


不同的音频编码器具有不同级别的(有损压缩[1]),它们在不同类型的内容上表现不一。鉴于Instagram内容的规模和范围,严格评估编码器最适合的内容,并跟踪音频质量相关指标非常重要。但我们不可能将大量实验工程实际应用于监测音频质量指标,所以我们采用最简单的解决方案:通过现有的参与度指标来证明Instagram的听众关心音频质量,改变音频编码器并不是一项简单的内容。因此我们决定将保留AAC编码器作为我们改进音频质量的实验编码器。


采样率会影响我们的音频编码并可以正确表示频率上限,奈奎斯特·香农采样定理[2]说:”若是波形的采样速度是最高频率成分的两倍,那么可以对带状有限连续信号进行采样的并从样本中完美重建。“Instagram使用行业标准44.1kHz采样率,超过大多数人可以听到的最大20kHz,所以我们会排除变化的采样率变量。


码率以千比特每秒(kbps)为单位测量音频文件中线性变化。换句话来讲更高的码率意味着音频编码中更多数据和更少压缩。这样低压缩可以保留原始文件中更多特性,同时具有更少的压缩失真。当码率太低时编码器会剔除它认为不太重要的音频细节。由于我们采用音频编码和采样率不变,并且改变码率很容易事情;所以实验中我们变化了很多音频码率改进。


码率实验


在内部音频质量改进之前,Instagram对视频中音频默认码率为64kbps。手机的麦克风不会产生丰富的音频信号,尽管码率较低;但Instagram音频压缩对大多数内容表现还算不错。随着Instagram创作者发布录音室的音频内容时(例如录制音乐),明显64kbps达不到高质量音频。


我们收到一些艺术家报告反馈称Instagram音频听起来“爆裂”或者质量太次的某些歌曲。我们立即观察测试Instagram到压缩控件中现象;例如:音乐帖故事中一些小鼓、镲片以及声音混响的压缩音频听起来比原始录音更生硬和空洞。


很遗憾我们不能单纯的为所有内容增加码率,由于总带宽限制。如果我们在音频和视频之间分配带宽,这只不过是一个零和游戏。高质量视频的码率非常高对于64kbps和128kbps的音频之间的差异对回放内容影响可以忽略不计。但是在低带宽情况下,我们一定会用低得多码率提供视频这种情况下回放内容体验64kbps时候会产生很差的音乐感觉。


虽然我们可以提高音频码率,但我们必须平衡音频质量和视频质量之间的权衡。增加所有内容的码率是特别危险的,因为我们知道大多数内容都有简单的音频,并且不会从音频方面的权衡中获益。在我们的实验中,我们的目标是为正确的内容做出正确的质量权衡。


特定内容和社区质量的偏好


为了找到关于Instagram听众对音频信号质量偏好的凡响,我们考虑了提高音频质量的方法。从我们之前关于视觉质量的实验中,我们知道体验的质量是主观的,并且是内容类型和社区类型所特有的。


音频质量灵敏度取决于每个听众对音频细节的关注以及播放器材的质量(例如默认音响设备或耳机)。我们担心一些使用低端手机扬声器的Instagram用户可能不会关注一般的音频质量。另一方面,音乐家们知道Instagram是一个他们可以创建音乐社区的平台,所以我们怀疑很多Instagram的听众会对音乐的音频质量很敏感。


我们更希望看到音频质量与Instagram音乐内容参与度之间的相关性最强,因为Instagram的音乐内容的音频范围很广,也很丰富。为了得到这个信号,我们对产品进行了有针对性的音频质量改进测试,我们希望音频质量对产品产生最大的影响:音乐贴故事。


image.png

来自Relient K音乐贴 播放歌曲Cat


音乐贴故事实验


为了避免非音乐内容的稀释,我们利用Instagram视频和音乐编码标签系统来放大A/B测试中故事类型音频编码。控制组中所有的音频编码都使用默认的64kbps码率。我们运行两个测试组:一组编码使用96kbps,另一组音频使用128kbps码率。


在实验结果中,我们看到通过提高音乐贴纸故事的音频质量,用户的参与度明显提高。128kbps测试组提供了最佳的结果。我们通过观看时间(即观看视频所花费的时间)和查看百分比衡量视频参与度(即观看者看完视频的百分比)。尽管在视觉质量和重新缓冲方面出现了倒退,但观看时间和查看百分比都有所提高。


我们预计到视觉质量和缓存会让体验退化,因为我们将带宽使用从视频转移到音频部分。但是参与度指标超出了我们的预期。这些指标表明即便是播放性能下降,Instagram观众也还是愿意观看完整音乐贴视频故事,因为音频质量更引人入胜。


未来的变化


Music Sticker Stories增加了音频码率只是为Instagram群体提供个性化视频内容体验的开始。为了帮助我们在音频质量、视频质量和流畅度之间做出正确平衡,我们正在考虑构建基于感知音频ABR(即自适应码率)和内容识别(即识别哪些视频内容具有音乐元素)的未来计划。


参考


[1] 有损压缩 https://en.wikipedia.org/wiki/Lossy_compression


[2] 奈奎斯特·香农采样定理


https://en.wikipedia.org/wiki/Nyquist%E2%80%93Shannon_sampling_theorem


————————————————

版权声明:本文为CSDN博主「LiveVideoStack_」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/94798244


「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。

阿里云视频云@凡科快图.png

相关文章
|
6月前
|
编解码
在智能媒体服务中,素材的清晰度差异可能是由以下几个原因导致
在智能媒体服务中,素材的清晰度差异可能是由以下几个原因导致【1月更文挑战第10天】【1月更文挑战第48篇】
73 3
|
1月前
|
自然语言处理 搜索推荐 Docker
CosyVoice实现声音复刻
这篇文章介绍了如何使用CosyVoice平台实现个性化的声音复刻,包括录制样本音频、上传处理以及生成定制化语音的全流程。
414 6
CosyVoice实现声音复刻
|
3月前
|
编解码 监控 网络协议
【绝密技巧】揭秘!如何用魔法般的步骤实现RTSP推送H.264与H.265(HEVC),打造震撼视听盛宴,让每一帧都充满魔力!
【8月更文挑战第15天】本文详述了如何使用RTSP流媒体服务推送H.264及H.265编码视频,适用于视频监控和直播平台。首先需确保环境支持这两种编码格式,可通过FFmpeg实现。在Ubuntu上安装FFmpeg后,可配置从摄像头捕获视频并推流至RTSP服务器。针对H.265编码,只需更改视频编码器为`libx265`。客户端可使用VLC播放器接收流。此外,还提供了C++示例代码用于自定义服务器实现,包括初始化上下文、打开编码器和循环编码视频帧。此教程旨在助力实现RTSP推送目标。
65 0
|
6月前
|
缓存 安全
Spotify音乐无法播放的问题如何解决
在使用Spotify时,你有没有遇到“该音乐无法播放”的错误?遇到这种错误时,如何进行应对?希望这篇文章能给为你进行解答
|
编解码 算法 数据可视化
用 Real-ESRGAN 拯救座机画质,自制高清版动漫资源
用 Real-ESRGAN 拯救座机画质,自制高清版动漫资源
174 0
|
网络协议
【2022】最新下載 YouTube 影片方法
2022年市面上有很相當多的YouTube下載工具,以及不少教程,但是這是有時效性的,很多工具當時有效,過一端時間就會失效,下麵我們介紹的方法,我們自己測試過,依舊可以正常使用。
1398 0
|
机器学习/深度学习 人工智能 自然语言处理
现实版「柯南变声器」来了,搜狗变声让你声音随心变
声音秒变志玲姐姐,秒变「矮大紧」,秒变萝莉、正太,现在通通不是问题!
704 0
现实版「柯南变声器」来了,搜狗变声让你声音随心变
|
Web App开发 编解码 中间件
海康威视摄像头RTSP视频流嵌入到谷歌Chrome等WEB页面中实时播放方案(图文教程)
近期在做一个智慧城市项目,要求将海康威视、大华等摄像头RTSP视频流在Chrome、Firefox、Edge等浏览器中播放,并且要求延迟必须要低,能到多低就多低,最好是实时视频。 小编了解很多不同的方案,目前市面上大部分是转码转流方案,不仅需要服务器支持,并且需要服务器不停的转码转流,如果多路同时播放或者播放高清视频,非常容易出现卡顿、花屏等情况,延迟更是高达数秒甚至数分钟,对于一些延迟要求较高的项目来说,这简直是灾难性后果。
2900 0
海康威视摄像头RTSP视频流嵌入到谷歌Chrome等WEB页面中实时播放方案(图文教程)
推荐15个在线多媒体(图片、音频、视频)编辑器,互联网营销
  在处理多媒体文件的时候,我们通常都是使用自己电脑上已安装好的桌面应用程序,如果某天我们在使用的公共电脑上没有我们需要的软件,更坏的情况是,这些公共电脑不允许安装软件,这时候就需要在线的编辑器了。最近几年,Web应用程序越来越受到关注,原因在于它的简单、方便和轻巧,只要你有一个连接到互联网的浏览器,就可以马上处理你的图片、音频和视频。
2746 0
下一篇
无影云桌面