圣诞节,在奶奶身边云烤火!

简介: “听这声音仿佛回到了小时候,不仅脑海里有画面,甚至还有温度味道。”“隔着屏幕已经感受到火光和扑面而来的温暖了”“没想到在淘宝直播间也能听到asmr”

原创 淘系音视频技术 淘系技术  2020-12-25

image.png

“听这声音仿佛回到了小时候,不仅脑海里有画面,甚至还有温度味道。”

“隔着屏幕已经感受到火光和扑面而来的温暖了”

“没想到在淘宝直播间也能听到asmr”


有这样一个特别的直播间,一位75岁的老奶奶,在淘宝直播间给烧柴火给网友听。


来自奶奶的科普:不同的柴火能烧出不同的声音


还真别说,直播间里,我们可以清晰地听到:稻田秸秆的滋滋声、玉米秸秆的沙沙声......


每一块柴火发出不同的声音,让人感到温暖又解压!闭上眼,仿佛感觉自己也坐在奶奶身边,陪着一起烤火~


伴随电商直播的火热发展,直播场景和直播形式也越来越多样化,除了烧柴的奶奶,还有很多音乐直播间,不少主播也会将直播场地选在开阔喧嚷的户外、喧闹的商场甚至是市场......复杂的场景化无疑对音频处理技术提出了更大的挑战!


阿里巴巴集团CTO鲁肃也曾分享了他购买古琴的经历,买古琴不能通过常规的图文描述来分辨古琴的好坏,卖家将程立引导到直播间,通过主播讲解,在直播间听声音来分辨古琴好坏。买到琴后发现琴的声音跟直播间里听到的完全一样,鲁肃对淘宝直播间乐器的音质大加赞赏,这种所见即所得的感觉是直播最大的优势。


音乐直播间高保真体验:


image.png


清音质的体验一直是我们追求的重点。口播是主播卖货最直接有效的交流方式,但主播直播间声音环境复杂、音频设备多种多样、应用场景差异性大,从而导致一些场景的音质体验受到挑战。淘宝直播多样化的直播场景和声学设备类型,导致我们很难用一个通用算法解决所有声音问题,为此我们针对一些问题进行有针对性的优化工作。

   

历史上淘宝直播的场景以语音直播为主,后来随着商品场景的丰富,乐器、音乐直播逐渐增多。通过调研我们知道乐器商家对音质的要求非常严格,稍有失真就会直接影响销量。为了解决该问题,我们全链路分析影响音乐信号的环节,找到优化点,对每个产生音质损伤的点进行优化。


image.png

直播音频链路音质影响分析

生产侧

消费侧

音频编码

降噪处理

采集模式

播放器

硬件端

好的外接设备

低延时播放器

编解码模式和

不合理的降噪

采集模式影响

能够提供更好

对音频的加速

采集的原始音

参数会直接影

对音质有严重

的原始采集音

等处理会影响

频质量

影响

响音质

音质


上图列出了一些影响直播音质的环节,乐器直播一般都会配置声卡设备,所以硬件端一般输入音质都比较好。音频采集模式对音质影响较大,原始采集基本无损,但是如果加了系统自带的算法处理,音质会大打折扣,并且不合适的采集模式会导致外置声卡不可用。降噪、编解码和播放器的处理都是算法层面的影响,算法处理不当,会导致信号的频率失真、频宽等问题。最终,经过优化之后,乐器直播场景音质得到了极大提升,通过AB test验证,优化之后乐器场景粉丝平均停留时长增加明显。


线上优化前乐器直播效果:

image.png


线上优化后乐器直播效果:


image.png


“让画面更清晰,让声音更动听,打造最佳的视听体验”,一直以来都是淘宝直播体验优化的重点。在过去一年中,我们围绕音质和画质,建设了端侧窄带高清技术,使用图像增强的技术来提升低端设备的画质,并采用ROI感知编码来提高重点区域的质量。在音频方面,我们自研了基于数据驱动的智能降噪,在主观和客观指标上都对齐甚至超过了竞品,在消除噪声的同时对人声进行最大限度的保留;我们还推出高音质直播间,显著提升乐器类直播观看时长;通过采用自研软件3A,解决各种手机音质不一致的问题。


我们会持续优化画质和音质。通过主观质量优化来进一步提升直播间画质,通过智能PLC技术来恢复网络丢包,通过场景检测来识别当前的直播环境,并据此来选择最佳的语音降噪模式和降噪强度;我们还会设计声音美化功能,让男主播的声音更浑厚,女主播声音更清澈;在声音互动方面,我们还会支持直播连麦的变声功能,有效保护特定人群隐私。我们还会跟达摩院同学一起,在直播间引入智能语音TTS,ASR能力,提供语音播报,语音消息,实时字幕能力,更好的服务于主播和用户。


>>>点击查看原文


相关文章
|
7月前
|
存储 人工智能 Serverless
大学生们注意了,你的拜年姿势准备好了吗?
来尝试一种全新的“数字人”拜年方式吧。上传个人照片,即可一键创建数字人分身,还可以搭配春节服饰、背景、拜年模板,生成专属的数字人拜年视频,简单无门槛,有心更有新。
128 7
|
分布式计算 Oracle 关系型数据库
阿里云的这群疯子
欢呼与流泪的故事。梦想永在,自证预言。
52099 14
|
程序员
七夕来袭——属于程序员的浪漫
七夕来袭——属于程序员的浪漫
七夕来袭——属于程序员的浪漫
|
前端开发 小程序 Java
1024特刊|要不是家里穷,我也不想当码农
三掌柜有一句说的好:要不是家里穷,我也不想当码农;要不是家里没矿,我也不想四处流浪。
690 1
1024特刊|要不是家里穷,我也不想当码农
|
人工智能 编解码 达摩院
中秋,和千年前的朋友一起上央视
昨天,杭州图书馆和达摩院的合作项目「AI算法复现古人“吟咏”中秋画面」,获得了CCTV13的报道。
496 0
中秋,和千年前的朋友一起上央视
|
开发者
荐书有礼!今天,你读书了吗?
4月23日,“世界读书日”,今天,你读书了吗?请把曾经影响你的书写下来,曾经弥足珍贵记录下来,让它的能量继续释放,影响更多的同行人!阿里云开发者社区“记录阅读之路,影响同行之人!”精选好书推荐留言,等你来参与!
荐书有礼!今天,你读书了吗?
|
云安全 安全
今天和朋友们做了五道新春大餐!
农历新年将至 安全君携几位好伙伴们, 给大家献上几道“新春大餐”。 愿您在新的一年里, 安心、顺心、省心! 第一道: 阿里云与PCCW Global  共同为全球用户提供DDoS防御服务 让更多企业的业务, 穿上稳定、有效的防护铠甲。
1889 0
|
消息中间件 分布式计算 Hadoop
除了吃月饼,中秋节还能干啥? | 9月12号栖夜读
今天的首篇文章,讲述了:明天八月十五,团圆夜花好月圆之际!除了吃月饼,还能干啥?
2963 0
|
运维 Java 分布式数据库
阿里云“网红"运维工程师白金:做一个平凡的圆梦人 | 9月11号栖夜读
今天的首篇文章,讲述了:他是阿里云的一位 P8 运维专家,却很有野心得给自己取花名“辟拾(P10)”;他没有华丽的履历,仅凭着 26 年的热爱与坚持,一步一个脚印踏出了属于自己的技术逆袭之路;他爱好清奇,练就了能在 20 秒内从20000个像素块里找出不同颜色像素的“特异功能”;他乐观豁达,一言不合就讲段子的性格让他成为身边同事的“开心果”;临近不惑之年的他,经历过很多故事,但他在用自己的行动向这个世界诠释着什么是 IT 工程师告别平庸的“不惑生活”。
2911 0
下一篇
DataWorks