芯片“自”造:智能音箱从支点到拼图的进阶史

简介: 智能音箱这次把炮火打到了“芯片”战场。

智能音箱这次把炮火打到了“芯片”战场。


2019年第四季度,根据Strategy Analytics、Canalys等市场调研机构公布的智能音箱市场数据,小度以1900万年度出货量位居行业第一且增速最快,其中在带屏音箱领域领先幅度较大,天猫精灵、小米位列二三。


当外界以为,2020年各大头部厂商会使尽招数继续死磕出货量时,领先的百度又回归技术,在芯片上下起了工夫:最新发布的新一代智能音箱——小度智能音箱 2 红外版,搭载的是百度首款针对远场语音交互研发的鸿鹄芯片,在唤醒、识别及功耗等方面让行业眼前一亮,尤其高躁音下首次唤醒率提升了10%以上,业内人士或许更了解这个数字意味着什么,达到一定程度后这一指标再提升1%都很难。


这令人意外但又在意料之中——站在技术制高点,沿着技术路线上把产品做到极致,从市场引领,到技术引领,是一贯的“百度式”做法。


虽然是一款无屏智能音箱,却让外界看到了跨越式的性能提升。百度副总裁景鲲曾对小度如何领跑智能音箱赛道给出了产品体验、品牌效应、开拓渠道、探索商业化的“四大飞轮”谋局,显然,从芯片切入,以产品性能带来“用户体验”的提升,也是四大飞轮的体现之一。


在卓越的性能提升面前,“用户体验”这个飞轮发生质的变化,当百度鸿鹄芯片在小度全系列产品应用之后,会引起行业什么样的反响?行业下一步的竞争会走向何方,同行业玩家的“跟随”还会继续、还能继续吗?


“智能相对论”认为,个案上,百度小度通过搭载一块自造的芯片完成了属于自己的智能拼图,为两年的发展历程划上了阶段性句号,而行业角度,芯片自造暴露出各玩家发展路径差异化已经十分明显,这种差异将继续深化下去。



01发展两年后,智能音箱完成最后一块“智能拼图”


拆解智能音箱的发展状况,无非从这四个方面着手:底层硬件、产品形态、交互体验以及内容服务。


过去两年,智能音箱后三块拼图的样子基本都被描绘出来,现在回到了最基础的底层硬件上。



1、产品形态:总是距离半步的行业竞逐



如果我们回顾小度各产品的推出过程,过去两年是典型的产品形态“交错式”推进:


2018年3月,国内率先发布带屏产品“小度在家”;


2018年6月,发布无屏小度智能音箱,随后11月发布小度智能音箱Pro;


2019年2月,小度在家1S发布,4月,小度智能音箱1S发布,7月发布了针对年轻人的新品Play;


2019年12月,带屏新品类智能屏X8发布,2020年3月底智能屏Air发布;


现在,又轮到无屏产品,主打芯片自造的小度智能音箱 2 红外版发布。


这里不是要记流水账,从时间线上,如果把行业玩家放在一起对比,就可以在带屏领域发现非常有意思的“距离半步”现象:


小度带屏产品真正意义上广受欢迎的小度在家1S发布在2019年2月,随即小米发布了小米小爱触屏音箱,两个月后,天猫精灵春节发布会发布其首款带屏产品天猫精灵CC;


然后,天猫不断发力带屏产品,9月推出天猫精灵CCL、11月推出天猫精灵CCH,而12月,百度却不再通过“带屏”概念应招,而直接以小度在家智能屏X8进行智能屏的“品类”升维竞争,定义AI智能交互、AI智能理解、内容服务新生态“智能屏三大要素”,把带屏产品的内涵和外延进行了扩充和固定,到今年3月,小度在家智能屏Air巩固了这种升维竞争。

image.png

很明显,一方面,小度用两年时间构建起自己完整的产品形态布局,另一方面,总是领先竞争者半步让小度在带屏产品方面成为绝对的领导者,天猫精灵成为跟随者,跟了一次的小米甚至有掉队的危险。



2、交互体验:方式更多+效果提升并行



交互体验包括两个方面,一是交互方式的丰富,二是交互效果的提升,两年时间,智能音箱两条腿走路,框架和深度能力都已经建立。


在交互方式方面,2019年7月,小度在家上线全双工免唤醒能力,意味着智能音箱进入全双工语音交互时代;此外,横向类型上,12月智能屏X8的推出,也是远场语音交互、人脸识别、手势控制、眼神唤醒多种交互方式碰撞的体现。


快速识别“童脸”、手势隔空控制播放/暂停、一个眼神唤醒……在智能音箱上,用户的交互选择越来越多,也越来越随意和自然。


到了2020年,交互方式还在发生新的变化,3月初小度音箱上线了语音定制功能,即通过某些简单的操作让智能音箱的音色变成自己或家人的声音,这使得智能音箱成为更有亲和力的产品。


当然,在交互方式升级过程中,行业的追逐仍然存在,多样化的交互方式继小度后都逐步成为各家的标配,而小度语音定制功能推出后不久,小米也发布了自己的定制功能。


而在交互效果的提升方面,进步一直有,但大跨步的进步,可能要等到这次小度搭载百度自造芯片才算。


根据百度实验室的测试结果,在安静环境2.5米距离内,小度智能音箱 2 红外版360°识别字准率达99%,这一数据比第一代小度智能音箱高2%,比市场上其他品牌智能音箱产品高10%,而句准率95%更是高出竞品24%;在家庭电视噪声环境2.5米距离下,这一对比更加明显:小度智能音箱 2 红外版360°识别字准率95%、句准率88%,分别较竞品提升了40%、75%。

image.png

智能音箱的交互效果提升,可能藉由芯片,在一个新的高台重新开始。



3、内容服务:颗粒度竞赛完成初步赛程



不得不承认的是,在小度在家刚刚推出时,产品形态仍然是创新和竞争的主基调,因而内容服务不算深入。


官方当时称“集成了海量音乐曲库及热播剧集电影综艺节目,有1400万个百科知识,搭载爱奇艺电影和百度音乐等”,以现在的目光看,不算太丰富。


对比当前小度智能音箱全系产品的内容服务:


覆盖游戏娱乐、医疗健康、教育、购物、社交、生活服务等场景,有快手、抖音、B站、优酷、全民K歌、喜马拉雅、荔枝直播等热门内容源,满足0-12岁儿童群体、90后/95后Z世代人群、中老年人群等不同年龄阶段需求。

image.png


过去两年,以小度为代表,智能音箱的内容服务呈现由单场景到多场景、来源越来越多样化(例如小程序)的颗粒度细化路径,到智能屏X8开始,由于内容服务生态被定义为品类的构成要件之一,智能音箱的内容服务快速完成了全年龄、全场景、全功能(主要指快递、外卖、购物等生活服务)的框架构建,后续的颗粒度细化将进一步加速。


回过头来看,智能音箱在产品形态、交互体验以及内容服务都完成了某种阶段性的发展进程,最基础的底层硬件却一直没有大的突破。


在小度智能音箱 2 红外版之前,小度全系产品与行业其他玩家一样搭载的是ARM CPU解决方案,这是一种物联网通用CPU架构,从技术上说,运行AI算法还需要某些转换过程。

image.png

百度鸿鹄打通数字信号处理与语音识别实现端到端一体建模识别,改变了智能音箱需要借助通用芯片方案的尴尬处境,作为原生适应AI语音算法的芯片,对上述产品形态、交互体验、内容服务进行更大发挥有不言而喻的价值。


软件的进步永远是性能榨取式的,只有硬件才能根本上实现质的飞跃,芯片是智能音箱“智能拼图”不可或缺的一块,百度鸿鹄把它补上了,但这仅仅是个好的开始。


02

芯片“自”造,意味着智能音箱行业赛道正式分野?


盘点两年的发展,在鸿鹄出现在智能音箱前,行业的其实已经有赛道选择的差别,随着智能拼图最后一块的完成,智能音箱行业赛道可能也正式分野,不同的发展模式、不同的发展目标、不同的价值定位,都清晰表现出来。



1、技术发展上,“突破性技术创新”与“延续性技术创新”两派泾渭分明



顾名思义,与过去全然不同、发生质的飞跃的技术内容创新,称作“突破性技术创新”,而只是把已有的技术拿来借用,或者修修补补,就是“延续性技术创新”。


以语音定制为例,小度智能音箱的能力来源于百度AI的语音能力,在硬件产品之前,百度地图就已经在使用,百度自我完成了语音定制的突破性技术创新。


而小米采取的方式是与“深声科技”合作获取声音克隆技术,“借技术”进行交互体验升级,这只是一种延续。同样的,在全双工语音交互、手势识别、眼神唤醒等方面,这种自我突破与借用技术的分别,在包括天猫精灵在内的行业里一直十分明显。


而到了百度鸿鹄芯片这里,“突破性技术创新”与“延续性技术创新”则泾渭分明,原生AI算法架构与通用ARM架构的技术区别不用多说。



2、场景应用上,跨场景兼容与垂直场景深耕“人各有志”



天猫精灵最近了开发了AI美肤技术(这是一种图像优化技术的“延续”)并推出智能音箱基础上的智能美妆镜概念产品,此外,阿里深谙的电商类语音识别和需求满足能力同样在天猫精灵上有很好的展示,语音购成为重要亮点。


而小米则醉心于智能家居的全连接,尽管这个能力似乎各大竞品都已经天然具备,有些做得不比小米差,只是自有硬件没有小米生态丰富。


这些都说明,它们没有改变旧有的场景印记,天猫的美妆、购物场景是老本行,小米生态也是其“资本故事”的重要来源。


而与此对应的是,过去两年,百度小度没有“原生场景”的负累,以底层化的平台方式超越了场景限制,虽然已经有了儿童教育场景的强势,但从众多场景的覆盖状况看,小度的目标是完成全场景的渗透,这其中,由于平台需要适应多样化的场景内容与交互方式,适应不同情形下用户流畅体验的需求,一颗原生绑定AI算法的芯片就显得尤为重要,也是全场景能力的重要标志。



3、行业站位上,独立生态与AIoT环节两种价值定位凸显



如果只是服务于单个场景,借用一些延续性的技术进行创新,智能音箱的最终“归宿”必然是成为AIoT生态的一个环节。


这两年,天猫精灵服务于新消费生态的痕迹越来越浓,而小爱同学还在与小米手机谁来当“控制核心”的地位问题僵持中。


小度似乎打造了独属于智能音箱的完整生态,与智能手机一样,硬件终端品牌+各路内容服务商,共同服务于多样化的场景,构成生态的闭环。


随着芯片尘埃落定,小度下一步或许是把内容服务做成智能手机那样的开放式安装模式,而不是当前以官方合作模式为主。同样地,凡事有利有弊,如果只是做AIoT环节,智能音箱能够借助平台和链条的力量做市场渗透,而做独立生态,自己就是平台就是链条,实现市场渗透投入的资源要更多。


当然,必须说明的是,成为智能家居AIoT生态核心也是小度附带的、必带的能力。此次的新品小度智能音箱2红外版自带360°红外发射器,支持超过99%的红外家电,空调、风扇、电视、灯具等传统家电可直接纳入“全屋智能生活”体系当中。到目前为止,小度智能音箱已连接超过1.1亿台设备,覆盖400多个家电品牌,国民智能家居生活“标配”的地位确立。



03销量竞赛仍在继续,但智能音箱玩家回归各自生态


这两年,小度逐步占据智能音箱出货量的头把交椅,也曾经占据过带屏音箱出货量遥遥领先的绝对优势,现在仍然在带屏领域是领导者。


而小度智能音箱2红外版的推出,也可以看作是借芯片巩固无屏产品优势的行为,高性能语音体验智、更省电节能环保等标签下,音箱在国民产品中更进一步。


两年后,行业这场销量的竞赛仍然在继续,但是,正如前文所言,不同玩家的“追求”显露出明显的差异,各自的侧重点发生变化。


一个就是要购物的用户可能会下意识选择天猫精灵,小米粉、全屋小米生态的极客们当然会选择小爱同学,一个希望通过智能音箱享受多方位服务的用户可能会选择小度……这是行业玩家心中的理想状态。但凡事都在变化,随着小度生态的逐步完善,语音购(京东及第三方服务商)等内容或服务功能的接入,IoT落地规模和产品控制力的增强,一个独立全场景智能音箱生态也会自然完成对购物、IoT场景的渗透。


总得来看,销量上的竞争仍然激烈,但智能音箱玩家因为路径的不同,场景发生不同程度的分化,从各个场景出发“一起做大蛋糕”的行业竞争氛围逐步形成,行业整体发展状况比过去更加良性。


而从更长远的视角看,将智能音箱打造成与智能手机类似的全场景生态的做法,使得小度这样的品牌最终将逐步渗透竞品原来的优势场景,实现市场的全面占领,从而使得智能音箱在成为国民产品后,还可能走入单一品牌“一统天下”的格局。


不妨拭目以待。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
5月前
|
人工智能 边缘计算 自然语言处理
麦芒30全新绽放,中国电信勾勒出AI手机的新方向
2024年,AI手机迎来爆发,高通CEO称其为关键元年。各品牌如三星、华为、OPPO、小米及苹果纷纷涉足。中国电信发布首款AI手机麦芒30 5G,搭载星辰大模型,提供智能问答、语音转写等服务。市场预期AI手机销量将显著增长,但消费者是否买单仍取决于实际体验。麦芒30 5G针对年轻人提供AI集成的个性化体验,如多方言识别、智慧应用及AI增强的云盘服务。中国电信的运营商背景为其带来差异化优势,结合AI+战略和云网融合,有望重塑市场格局。生成式AI正改变行业,运营商的加入加剧竞争,智能手机市场或将迎来重大变革。
103 1
|
机器学习/深度学习 人工智能 自然语言处理
炸裂全场!百度如流超级助理、Comate X两大黑科技全面开挂,工作生产力狂飙
用户只需要准确描述需求,在执行任务的过程中不需要或者仅需人类简单的确认操作,至于如何理解需求、如何整合系统、如何生成答复,都由AI自动去完成,很多冗长的过程被大模型的能力给“折叠”了。
163 0
|
传感器 人工智能 算法
外骨骼机器人混战:程天科技做“深”,傅利叶智能做“广”
外骨骼机器人商用范围愈加广泛,产业发展不断提速。
101 0
|
传感器 机器学习/深度学习 人工智能
拼多多还能更「接地气」:AI要和老农来一场种草莓大比拼
经济发展进入新时期,科技公司也要转型。拼多多希望能够联合最顶尖的农业科研团队,打造 AI 程度最高的草莓生产方式。
133 0
拼多多还能更「接地气」:AI要和老农来一场种草莓大比拼
|
机器学习/深度学习 人工智能 算法
揭秘美图影像实验室:数据、算法和一件关于美的事
自成立以来,美图影像实验室的研究成果几乎改变了美图软件、硬件中所有功能。一键美颜、实时美妆,或是时下相当流行的美图秀秀手绘功能,都有这个实验室的功劳。
386 0
揭秘美图影像实验室:数据、算法和一件关于美的事
|
物联网 定位技术 芯片
“智”造多彩客厅,智能灯带如何点亮全屋智能?
应用速递栏目:应用速递是面向IoT厂商推荐芯片开放社区(OCC)上的典型应用案例,便于IoT厂商精准获取方案,快速实现产品落地。
204 0
“智”造多彩客厅,智能灯带如何点亮全屋智能?
|
机器学习/深度学习 传感器 自动驾驶
|
人工智能 供应链 算法
方寸之困:纳米级芯片通关路
逼近摩尔定律极限,会越来越难
|
人工智能 自然语言处理 物联网
智能音箱碎碎念
这是一篇碎碎念,没有什么逻辑,没有什么目的。之前为了推广自家扫地机,发了一条可以用各种音箱控制扫地机的朋友圈,没想到很多人看到之后让推荐智能音箱。那么就总结一下用过的智能音箱,顺手给大家拔拔草种种草,也趁这个机会理一下自己的看法。
1535 0