圣诞节,在奶奶身边云烤火!

简介: “听这声音仿佛回到了小时候,不仅脑海里有画面,甚至还有温度味道。”“隔着屏幕已经感受到火光和扑面而来的温暖了”“没想到在淘宝直播间也能听到asmr”

原创 淘系音视频技术 淘系技术  2020-12-25

image.png

“听这声音仿佛回到了小时候,不仅脑海里有画面,甚至还有温度味道。”

“隔着屏幕已经感受到火光和扑面而来的温暖了”

“没想到在淘宝直播间也能听到asmr”


有这样一个特别的直播间,一位75岁的老奶奶,在淘宝直播间给烧柴火给网友听。


来自奶奶的科普:不同的柴火能烧出不同的声音


还真别说,直播间里,我们可以清晰地听到:稻田秸秆的滋滋声、玉米秸秆的沙沙声......


每一块柴火发出不同的声音,让人感到温暖又解压!闭上眼,仿佛感觉自己也坐在奶奶身边,陪着一起烤火~


伴随电商直播的火热发展,直播场景和直播形式也越来越多样化,除了烧柴的奶奶,还有很多音乐直播间,不少主播也会将直播场地选在开阔喧嚷的户外、喧闹的商场甚至是市场......复杂的场景化无疑对音频处理技术提出了更大的挑战!


阿里巴巴集团CTO鲁肃也曾分享了他购买古琴的经历,买古琴不能通过常规的图文描述来分辨古琴的好坏,卖家将程立引导到直播间,通过主播讲解,在直播间听声音来分辨古琴好坏。买到琴后发现琴的声音跟直播间里听到的完全一样,鲁肃对淘宝直播间乐器的音质大加赞赏,这种所见即所得的感觉是直播最大的优势。


音乐直播间高保真体验:


image.png


清音质的体验一直是我们追求的重点。口播是主播卖货最直接有效的交流方式,但主播直播间声音环境复杂、音频设备多种多样、应用场景差异性大,从而导致一些场景的音质体验受到挑战。淘宝直播多样化的直播场景和声学设备类型,导致我们很难用一个通用算法解决所有声音问题,为此我们针对一些问题进行有针对性的优化工作。

   

历史上淘宝直播的场景以语音直播为主,后来随着商品场景的丰富,乐器、音乐直播逐渐增多。通过调研我们知道乐器商家对音质的要求非常严格,稍有失真就会直接影响销量。为了解决该问题,我们全链路分析影响音乐信号的环节,找到优化点,对每个产生音质损伤的点进行优化。


image.png

直播音频链路音质影响分析

生产侧

消费侧

音频编码

降噪处理

采集模式

播放器

硬件端

好的外接设备

低延时播放器

编解码模式和

不合理的降噪

采集模式影响

能够提供更好

对音频的加速

采集的原始音

参数会直接影

对音质有严重

的原始采集音

等处理会影响

频质量

影响

响音质

音质


上图列出了一些影响直播音质的环节,乐器直播一般都会配置声卡设备,所以硬件端一般输入音质都比较好。音频采集模式对音质影响较大,原始采集基本无损,但是如果加了系统自带的算法处理,音质会大打折扣,并且不合适的采集模式会导致外置声卡不可用。降噪、编解码和播放器的处理都是算法层面的影响,算法处理不当,会导致信号的频率失真、频宽等问题。最终,经过优化之后,乐器直播场景音质得到了极大提升,通过AB test验证,优化之后乐器场景粉丝平均停留时长增加明显。


线上优化前乐器直播效果:

image.png


线上优化后乐器直播效果:


image.png


“让画面更清晰,让声音更动听,打造最佳的视听体验”,一直以来都是淘宝直播体验优化的重点。在过去一年中,我们围绕音质和画质,建设了端侧窄带高清技术,使用图像增强的技术来提升低端设备的画质,并采用ROI感知编码来提高重点区域的质量。在音频方面,我们自研了基于数据驱动的智能降噪,在主观和客观指标上都对齐甚至超过了竞品,在消除噪声的同时对人声进行最大限度的保留;我们还推出高音质直播间,显著提升乐器类直播观看时长;通过采用自研软件3A,解决各种手机音质不一致的问题。


我们会持续优化画质和音质。通过主观质量优化来进一步提升直播间画质,通过智能PLC技术来恢复网络丢包,通过场景检测来识别当前的直播环境,并据此来选择最佳的语音降噪模式和降噪强度;我们还会设计声音美化功能,让男主播的声音更浑厚,女主播声音更清澈;在声音互动方面,我们还会支持直播连麦的变声功能,有效保护特定人群隐私。我们还会跟达摩院同学一起,在直播间引入智能语音TTS,ASR能力,提供语音播报,语音消息,实时字幕能力,更好的服务于主播和用户。


>>>点击查看原文


相关文章
|
Java Shell Docker
Docker启动后怎样运行jar包文件
Docker启动后怎样运行jar包文件
|
1月前
|
存储 文件存储 Docker
用 Docker 一键部署 Filestash:打造你的全能 Web 文件管理器
还在为不同存储协议装一堆客户端?SFTP、FTP、WebDAV、S3、云盘……每次都要切换工具,传个文件像“打地鼠”?今天给大家安利一个神器——Filestash,一个开源的 Web 文件管理器,把所有存储协议都收进浏览器里,用 Docker 几分钟就能搭好,运维、开发、日常用都超爽!
303 0
用 Docker 一键部署 Filestash:打造你的全能 Web 文件管理器
|
传感器 芯片
毕业设计|基于51单片机的空气质量检测PM2.5粉尘检测温度设计
毕业设计|基于51单片机的空气质量检测PM2.5粉尘检测温度设计
418 0
|
1月前
|
域名解析 网络协议
二级域名解析教程 新手零基础操作流程【附检测方法】
二级域名解析教程,专为新手打造零基础操作流程,详细拆解域名管理、参数配置、生效等待及检测步骤,涵盖A类型、CNAME类型等常用解析方式,附简单检测技巧,还为无自有域名的用户推荐靠谱的二级域名服务渠道,让新手轻松完成二级域名解析,快速投入使用。
二级域名解析教程 新手零基础操作流程【附检测方法】
|
7月前
|
缓存 JavaScript
vue中的keep-alive问题(2)
vue中的keep-alive问题(2)
612 137
|
2月前
|
数据采集 缓存 监控
OpenClaw 阿里云/本地部署+跨境电商爬虫实战指南|千问API配置+10大场景突破及避坑教程
2026年,OpenClaw(Clawdbot)已成为跨境电商从业者的核心情报工具——通过安装专用Skill(工具模块),它能突破Reddit、Amazon、TikTok等高反爬平台的限制,实现舆情监控、选品分析、数据结构化提取等核心需求。原生OpenClaw仅支持基础HTTP请求,面对JS渲染、IP封锁、懒加载等反爬机制时往往“束手无策”,而专用Skill的接入让其具备“开天眼”的能力,从简单工具升级为跨境电商的“超级情报大脑”。
763 0
|
机器学习/深度学习 存储 人工智能
《DeepSeek情感分析技术:突破与创新,精准判断情感倾向》
在数字化时代,文本数据激增,情感分析成为关键需求。DeepSeek作为AI领域的佼佼者,基于Transformer架构实现深度语义理解,通过多模态融合技术全面感知情感,结合领域自适应与迁移学习跨越不同场景,采用对抗训练提升鲁棒性,并融合情感词典与知识图谱增强理解。这些创新使DeepSeek能精准判断情感倾向,为企业和研究提供有力支持。
1618 20
|
机器学习/深度学习 存储 人工智能
【AI系统】模型转换基本介绍
模型转换技术旨在解决深度学习模型在不同框架间的兼容性问题,通过格式转换和图优化,将训练框架生成的模型适配到推理框架中,实现高效部署。这一过程涉及模型格式转换、计算图优化、算子统一及输入输出支持等多个环节,确保模型能在特定硬件上快速、准确地运行。推理引擎作为核心组件,通过优化阶段和运行阶段,实现模型的加载、优化和高效执行。面对不同框架的模型文件格式和网络结构,推理引擎需具备高度的灵活性和兼容性,以支持多样化的应用场景。
807 4
【AI系统】模型转换基本介绍
|
监控 JavaScript API
局域网监控软件的实时通知系统:利用Node.js和WebSocket实现即时消息推送
本文介绍了如何使用Node.js和WebSocket构建局域网监控软件的实时通知系统。实时通知对于网络安全和家庭监控至关重要,能即时发送监控数据变化的通知,提高响应速度。通过Node.js创建WebSocket服务器,当数据变化时,监控软件发送消息至服务器,服务器随即推送给客户端。此外,还展示了如何利用Node.js编写API,自动将监控数据提交到网站,便于用户查看历史记录,从而提升监控体验。
628 3
|
JavaScript
Vue实现按钮级别权限
文章介绍了在Vue中实现按钮级别权限的两种方法:使用自定义Vue指令和使用v-if指令配合自定义方法。
272 4
Vue实现按钮级别权限

热门文章

最新文章