圣诞节,在奶奶身边云烤火!

简介: “听这声音仿佛回到了小时候,不仅脑海里有画面,甚至还有温度味道。”“隔着屏幕已经感受到火光和扑面而来的温暖了”“没想到在淘宝直播间也能听到asmr”

原创 淘系音视频技术 淘系技术  2020-12-25

image.png

“听这声音仿佛回到了小时候,不仅脑海里有画面,甚至还有温度味道。”

“隔着屏幕已经感受到火光和扑面而来的温暖了”

“没想到在淘宝直播间也能听到asmr”


有这样一个特别的直播间,一位75岁的老奶奶,在淘宝直播间给烧柴火给网友听。


来自奶奶的科普:不同的柴火能烧出不同的声音


还真别说,直播间里,我们可以清晰地听到:稻田秸秆的滋滋声、玉米秸秆的沙沙声......


每一块柴火发出不同的声音,让人感到温暖又解压!闭上眼,仿佛感觉自己也坐在奶奶身边,陪着一起烤火~


伴随电商直播的火热发展,直播场景和直播形式也越来越多样化,除了烧柴的奶奶,还有很多音乐直播间,不少主播也会将直播场地选在开阔喧嚷的户外、喧闹的商场甚至是市场......复杂的场景化无疑对音频处理技术提出了更大的挑战!


阿里巴巴集团CTO鲁肃也曾分享了他购买古琴的经历,买古琴不能通过常规的图文描述来分辨古琴的好坏,卖家将程立引导到直播间,通过主播讲解,在直播间听声音来分辨古琴好坏。买到琴后发现琴的声音跟直播间里听到的完全一样,鲁肃对淘宝直播间乐器的音质大加赞赏,这种所见即所得的感觉是直播最大的优势。


音乐直播间高保真体验:


image.png


清音质的体验一直是我们追求的重点。口播是主播卖货最直接有效的交流方式,但主播直播间声音环境复杂、音频设备多种多样、应用场景差异性大,从而导致一些场景的音质体验受到挑战。淘宝直播多样化的直播场景和声学设备类型,导致我们很难用一个通用算法解决所有声音问题,为此我们针对一些问题进行有针对性的优化工作。

   

历史上淘宝直播的场景以语音直播为主,后来随着商品场景的丰富,乐器、音乐直播逐渐增多。通过调研我们知道乐器商家对音质的要求非常严格,稍有失真就会直接影响销量。为了解决该问题,我们全链路分析影响音乐信号的环节,找到优化点,对每个产生音质损伤的点进行优化。


image.png

直播音频链路音质影响分析

生产侧

消费侧

音频编码

降噪处理

采集模式

播放器

硬件端

好的外接设备

低延时播放器

编解码模式和

不合理的降噪

采集模式影响

能够提供更好

对音频的加速

采集的原始音

参数会直接影

对音质有严重

的原始采集音

等处理会影响

频质量

影响

响音质

音质


上图列出了一些影响直播音质的环节,乐器直播一般都会配置声卡设备,所以硬件端一般输入音质都比较好。音频采集模式对音质影响较大,原始采集基本无损,但是如果加了系统自带的算法处理,音质会大打折扣,并且不合适的采集模式会导致外置声卡不可用。降噪、编解码和播放器的处理都是算法层面的影响,算法处理不当,会导致信号的频率失真、频宽等问题。最终,经过优化之后,乐器直播场景音质得到了极大提升,通过AB test验证,优化之后乐器场景粉丝平均停留时长增加明显。


线上优化前乐器直播效果:

image.png


线上优化后乐器直播效果:


image.png


“让画面更清晰,让声音更动听,打造最佳的视听体验”,一直以来都是淘宝直播体验优化的重点。在过去一年中,我们围绕音质和画质,建设了端侧窄带高清技术,使用图像增强的技术来提升低端设备的画质,并采用ROI感知编码来提高重点区域的质量。在音频方面,我们自研了基于数据驱动的智能降噪,在主观和客观指标上都对齐甚至超过了竞品,在消除噪声的同时对人声进行最大限度的保留;我们还推出高音质直播间,显著提升乐器类直播观看时长;通过采用自研软件3A,解决各种手机音质不一致的问题。


我们会持续优化画质和音质。通过主观质量优化来进一步提升直播间画质,通过智能PLC技术来恢复网络丢包,通过场景检测来识别当前的直播环境,并据此来选择最佳的语音降噪模式和降噪强度;我们还会设计声音美化功能,让男主播的声音更浑厚,女主播声音更清澈;在声音互动方面,我们还会支持直播连麦的变声功能,有效保护特定人群隐私。我们还会跟达摩院同学一起,在直播间引入智能语音TTS,ASR能力,提供语音播报,语音消息,实时字幕能力,更好的服务于主播和用户。


>>>点击查看原文


相关文章
|
7月前
|
机器学习/深度学习 人工智能 计算机视觉
AI图像质感还原堪比专业摄影!Miracle F1:美图WHEE全新AI图像生成模型,支持超写实与多风格生成
美图WHEE推出的Miracle F1采用扩散模型技术,通过精准语义理解和多风格生成能力,可产出具有真实光影质感的专业级图像作品。
346 5
AI图像质感还原堪比专业摄影!Miracle F1:美图WHEE全新AI图像生成模型,支持超写实与多风格生成
|
6月前
|
存储 算法 安全
JWT深度解析:现代Web身份验证的通行证为什么现在都是JWT为什么要restful-优雅草卓伊凡
JWT深度解析:现代Web身份验证的通行证为什么现在都是JWT为什么要restful-优雅草卓伊凡
354 41
JWT深度解析:现代Web身份验证的通行证为什么现在都是JWT为什么要restful-优雅草卓伊凡
|
7月前
|
人工智能 编解码
导演失业预警!Seaweed-7B:字节7B参数模型让剧本自动变电影!20秒长镜头丝滑生成
Seaweed-7B是字节跳动推出的70亿参数视频生成模型,支持从文本、图像或音频生成高质量视频内容,具备长镜头生成、实时渲染等先进特性,通过优化架构显著降低计算成本。
351 10
导演失业预警!Seaweed-7B:字节7B参数模型让剧本自动变电影!20秒长镜头丝滑生成
|
7月前
|
人工智能 自然语言处理 物联网
"一丹一世界"二等奖 | TPSZ_二次元卡通梦幻插画风格-童梦拾光 创作分享
"一丹一世界"二等奖 | TPSZ_二次元卡通梦幻插画风格-童梦拾光 创作分享
224 7
|
10月前
|
Dart 前端开发 容器
【07】flutter完成主页-完成底部菜单栏并且做自定义组件-完整短视频仿抖音上下滑动页面-开发完整的社交APP-前端客户端开发+数据联调|以优雅草商业项目为例做开发-flutter开发-全流程-商业应用级实战开发-优雅草央千澈
【07】flutter完成主页-完成底部菜单栏并且做自定义组件-完整短视频仿抖音上下滑动页面-开发完整的社交APP-前端客户端开发+数据联调|以优雅草商业项目为例做开发-flutter开发-全流程-商业应用级实战开发-优雅草央千澈
348 18
【07】flutter完成主页-完成底部菜单栏并且做自定义组件-完整短视频仿抖音上下滑动页面-开发完整的社交APP-前端客户端开发+数据联调|以优雅草商业项目为例做开发-flutter开发-全流程-商业应用级实战开发-优雅草央千澈
|
存储 JavaScript 搜索推荐
Node框架的安装和配置方法
安装 Node 框架是进行 Node 开发的第一步,通过正确的安装和配置,可以为后续的开发工作提供良好的基础。在安装过程中,需要仔细阅读相关文档和提示,遇到问题及时解决,以确保安装顺利完成。
655 58
|
JSON API 数据格式
如何使用Python开发1688商品详情API接口?
本文介绍了如何使用Python开发1688商品详情API接口,获取商品的标题、价格、销量和评价等详细信息。主要内容包括注册1688开放平台账号、安装必要Python模块、了解API接口、生成签名、编写Python代码、解析返回数据以及错误处理和日志记录。通过这些步骤,开发者可以轻松地集成1688商品数据到自己的应用中。
210 1
|
机器学习/深度学习 运维 监控
智能运维未来:AIOps在预测性维护与故障排查中的潜力
【10月更文挑战第26天】随着数字化转型的深入,企业对IT系统的依赖日益增加。传统的运维方式已无法满足需求,智能运维(AIOps)应运而生。AIOps通过集成和分析多源数据,利用机器学习算法实现系统状态的实时监控和预测性维护,显著提升了运维效率和质量。 示例代码展示了如何使用Python和scikit-learn实现故障预测模型,进一步说明了AIOps的应用价值。
654 5
|
网络协议 Ubuntu Linux
会Linux系统上配IPv6地址的网工,那真是老6了!
会Linux系统上配IPv6地址的网工,那真是老6了!
369 0