亚马逊Echo为何在智能硬件中独领风骚

简介:

可穿戴设备鼻祖Jawbone最近陷入了困境,种种迹象表明:这家红极一时的独角兽正在衰落。

Jawbone是一家依赖概念和融资存活的企业,其主打产品智能手环并没有技术门槛,而且也没有挖掘出用户需求,销量远不及国外的Fitbit和国内的小米。其实,即便主打高端市场的Fitbit手环和打出低价牌的小米手环也是乏善可陈,既没有用户的当前刚需支持,又没有技术革新挖掘新兴需求,甚至都没有一定的技术门槛圈起小众市场。因此,当融资环境并不景气时,创业公司必然会失去话语权并走向衰落,一点儿也不会感到让人意外。

但是,Jawbone并不是孤立的案例,还有Google Glass、模块化手机等也都寿终正寝,它代表的是全球智能硬件创业公司的一种典型生存方式,这种方式强调概念,忽略价值,更加关注PR和融资,而不是核心技术和用户体验。从最近爆出的各种创业报道来看,智能硬件创业领域哀鸿遍野。

image

而与之形成鲜明对比的则是亚马逊的Echo智能音箱,全球各大媒体最近都在疯狂报道,试图分析和归纳出其成功的原因。亚马逊的Echo诞世5年以来,其销量一直稳步上升,据传今年累计销量能够达到千万量级,这对于售价达到179美元的智能硬件来说,确实是个亮眼的业绩,然而,更为重要的则是Echo的口碑积累一直非常不错。

为何智能硬件创业哀鸿遍野呢?

我们先从市场的本质属性谈起,在很多分析人士看来,Jawbone的失败是因为可穿戴设备的市场本身就是一个“伪命题”,而其他智能硬件,诸如智能家居,甚至服务型机器人所描述的需求,其本身就是伪需求。确实,有很多智能硬件创业公司试图创造一种用户需求,比如智能窗帘,但是这种毕竟还是少数。

那可穿戴设备和智能家居设备我们到底需不需要呢?从人性追求美、懒、嗨的进化趋势来看,这是必然的。其实,你手边就有好几个可穿戴设备,比如耳机,天然的可穿戴设备。至于智能家居,难道你内心真的不需要一个忠实的、随叫随到、还能无限干活的机器仆人吗?毋庸置疑需要呀!所以,与其寻找那么多市场的借口,不如先从创业公司自身来找找原因:

第一:融资驱动的创业公司太过娇气

典型的案例还是亚马逊,号称最残酷的华尔街,竟然容忍了这家公司20多年不盈利。还有我们国内的京东,他们的估值已经无法用任何数据来表示了,就连A股也难望其项背。这种超级宽容同样延伸到了创业领域,于是就有了Jawbone连续融资13轮存活下来。这就传递了一个非常危险的信号,全球很多创业公司,包括国内的诸多创业公司,自然而然就认为资本的钱是非常容易拿的,只要做做PR,讲讲故事,钱自然就到手了,而到底如何落地,如何盈利,收益怎样,这些最有价值的东西反而都被忽略了。

这种宽松资本环境的另一恶果就是让部分创业公司一直生活在温室之中,经不起任何市场的风吹雨打,既然钱如此好拿,为何创业者还苦逼的去思考、去干活呢?其实哪有容易切入、还能稳稳赚钱的市场,A股两千多家企业,又有几家是民营资本,少数成功的企业也都是苦熬磨难挺过来的。不管是美国,还是中国,必然的,创业者做的都是最累最苦的未来市场。即便比较成功的Echo音箱,也苦做了5年,项目几度被停掉,甚至首发都不敢宣传,而采用邀请的方式谨慎推广,而反观其他智能硬件的创业公司,满嘴概念,不见产品,Jawbone连耳机都做不好,何谈可穿戴设备的鼻祖呢。

第二:技术创业的公司几乎不做技术

这是很奇怪的现象,Jawbone做技术吗?似乎不做,因为从来没看到Up手环有什么革命性的变化或者将来有新的技术注入,很多时候我都在怀疑,这是一家工业设计公司。那么国内的智能硬件情况又怎样呢?除了已经死了的一大波山寨型的智能硬件公司,目前活跃的几家似乎也不乐观。

当然,技术投入是非常花钱的,亚马逊仅仅为了Echo的核心技术麦克风阵列,就相继投入了巨资,并且为此收购了多家公司。为了保证效果,Echo的主要成本还是花费在了麦克风阵列上,而国内又有几家这样去评估技术呢?正是这种苛刻的技术追求,才保证了Echo能有较好的声学效果,较短的延迟时间,而这才是实现真实场景下语音识别率提升的关键,自然,效果的提升就是语音交互更加的自然。

第三:技术创业从来不考虑用户体验

这个问题可以从微软开始谈起,即便技术再牛X,也不要强加给用户去适应,己所不欲勿施于人。不管是B端还是C端,用户都是最终掏钱的主,而很多创业公司一副牛X的样子凌驾用户之上,这违背了商业的最初逻辑。我们可以挖掘需求引领用户,但不意味着要让用户为技术创新直接买单,当然间接是必须的,否则企业的投入窟窿也补不上。

不尊重用户就很难做好用户体验,没有好的用户体验,自然就无法站稳市场,形成良性循环。但是,这一切都被2VC的创业公司忽略了,不琢磨用户的需求,反而研究起投资人爱好。所以Jawbone很难从用户角度去改进产品,他们有大把大把的机会,但是没有珍惜,而Echo音箱的团队则是必须仔细揣摩用户的每一个反馈,甚至因为同期竞争的其他方案,随时可以把他们的项目停掉。

为何亚马逊Echo却独领风骚?

再来看为何亚马逊Echo音箱的成功,我这里定义为成功,是因为智能音箱这个产品系列以后也会卖得不错。这个问题我曾与业界的资深投资人和市场战略分析人士深入探讨过,其中不乏峰瑞资本的李丰、朱祎舟,KEYTONE VENTURES的朱璘,和联想的李智勇,这几人曾主导投资过国内专业从事智能音箱解决方案,特别是麦克风阵列的新兴公司。

我们大概总结了三个方面,也回应一下圈子里盛传的生态链制胜一说,生态确实重要,但不是Echo成功的核心,因为早期Echo根本就没啥生态之说,哪有公司会为一个没有上量的音箱整合生态资源呢?

首先,来看Echo的需求,Echo毕竟是个音箱,因此其第一属性不是智能,而是音箱。音箱这可是一个大产业,国内就是个千亿级以上市场,A股也上市了不少传统音箱企业。这说明了什么?这是一个存在巨大机会的市场,需求是刚性的,虽然不及手机,但算下你家里的电子设备,除了家电,可不就是耳机和音箱?说到这里我总是有一种莫名的兴奋,因为用户手边的设备都和我们声学有着密切的关系,而这竟然被我们,还有投资人都给忽略了。

其次,有了需求,做不到也是没有意义的。以HiFi和电脑音箱为代表的传统音箱市场已经萎缩,新兴的蓝牙音箱销量很大,但是没有技术革新,反而把原本简单的听音乐需求搞复杂了。本来三个步骤可以听到音乐,现在要花费7步甚至10步繁琐的过程,而且还不一定能够听到。所以音箱其实非常需要技术革新。

怎么去做?WiFi音箱显然不行,同蓝牙音箱一样,简单的事情复杂化。智能音箱显然是个方向,但是这里要注意一点,智能音箱首先要解决它是一个“音箱”,声学在线也曾在《智能音箱未来如何?到底有哪些神秘的声学技术?》那篇文章里讨论过这个问题,做成一个好音箱这本身就需要深厚的技术积累才能做到。再加上智能,这又涉及到了更深的声学技术、语音识别、语义理解等技术,全球能整合这套技术的寥寥几家。即便看到Echo的成功,国内至今也没有仿制成功。

最后,还要谈谈智能的问题,到底我们该又如何理解智能呢?Echo给出了很好的示范,语音交互不是一种辅助技术,而是在很多场景要替代触摸屏的核心技术,是下一代的语音交互界面。因此,Echo十分鲜明的去掉了触摸屏,这十分大胆,但是却符合技术进化的趋势。

其实,很多时候,我们真的需要仔细思考人工智能的进化问题。O‘Reilly的CEO TIM曾经在Linkedin上探讨了”Fit and Finish“如何让交互更完整,著名作家、科技点评人李智勇老师同样持有这个观点。

国内为何没有出现类似的产品?

国内最先模仿Echo的产品就是京东和讯飞联合推出的叮咚音箱,但是销量并不好,另外一家小智音箱基本死掉了。为什么呢?很多媒体人和投资人都问过我这个问题,我和KEYTONE VENTURES的朱璘多次拉各种圈子深聊这些问题。

这两个产品,小智音箱是因为没有核心技术仅靠山寨死掉了,叮咚音箱的销量不佳则是涵盖了多个技术、生产和产品层面的问题。我不擅长分析别人失败的原因,留给更专业的投资届人士去和大家分享探讨。总得来说,这么久没有出现类似产品走俏,确实也打了我们仿造大国的脸面,从另一个侧面也说明,我们国家未来的消费升级确实要靠技术去驱动。从技术创业的角度来说,我特别认同峰瑞资本李丰的观点,这是一个价值回归,好人才能赚钱的时代,我们确实需要重新认识和评估技术的价值以及商业变现。

如何打造国内的智能音箱奇迹?

独乐乐不如众乐乐,要打造国内的Echo,必然要解决技术和产品的问题,而且应该发挥国内传统音箱行业的优势,带动更多厂商去合力打造智能音箱产业链条。由于智能音箱涉及的技术太过复杂,最好也有一家类似MTK的公司提供整体解决方案,做好底层的技术支撑和工业生产保障。

国内目前能够提供这种技术的公司非常少,当前仅有科大讯飞、声智科技和思必驰拥有成熟且经过市场验证的麦克风阵列技术,而这是Echo音箱的核心技术,也是Echo音箱的主要成本。但是仅仅有麦克风阵列技术还是不够的,因为这仅仅解决了智能问题,却没有解决音箱问题,显然,我们还需要一套从模组、OS到云端,包括麦克风阵列、语音识别、语义理解、音箱声效和声波对码等全套智能音箱的解决方案。这些厂商只有开放才会推动国内智能音箱的产业链条,从而带动围绕整个语音交互设计的生态,促进国内人工智能的技术和商业进展。但是,具体如何,还要让我们拭目以待!

本文转自d1net(转载)

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
网站备案工信部短信核验操作流程
阿里云网站备案工信部短信核验操作流程,网站备案通过阿里云初审后后提交到管局,需要进行工信部短信核验
1812 0
网站备案工信部短信核验操作流程
|
Arthas Java 应用服务中间件
我的程序突然罢工了|深入探究HSF调用异常,从死锁到活锁的全面分析与解决
本文详细记录了作者在处理HSF调用异常问题的过程中,从初步怀疑死锁到最终发现并解决活锁问题的全过程。
1091 49
|
人工智能 自然语言处理 Cloud Native
在阿里云,零门槛,即刻拥有DeepSeek-R1满血版
DeepSeek 是一款强大的推理模型,尤其擅长数学、代码和自然语言处理等复杂任务。通过阿里云平台,用户可以快速调用满血版 DeepSeek API 或部署不同尺寸的模型,无需编码,最快5分钟完成,最低0元起。方案提供100万免费Token,支持弹性算力,降低硬件成本,加速创新。 解决方案链接:[点击查看](https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms?utm_content=g_1000401616)
807 17
|
自然语言处理
高效团队的秘密:7大团队效能模型解析
3分钟了解7大团队效能模型,有效提升团队绩效。
1715 7
高效团队的秘密:7大团队效能模型解析
|
自然语言处理 算法 数据可视化
《一文吃透!NLTK与SpaCy,自然语言处理的神兵利器》
在自然语言处理(NLP)领域,NLTK和SpaCy是Python中两大利器。NLTK功能全面、语料库丰富,适合学术研究与教学;SpaCy则以高效、准确和易用性著称,专为工业级应用设计。两者各有所长,可根据需求选择或结合使用,助力开发者实现强大的NLP功能。
693 9
|
机器学习/深度学习 数据采集 传感器
基于深度学习的图像识别技术在自动驾驶中的应用研究####
本文旨在探讨深度学习技术,特别是卷积神经网络(CNN)在自动驾驶车辆图像识别领域的应用与进展。通过分析当前自动驾驶技术面临的挑战,详细介绍了深度学习模型如何提升环境感知能力,重点阐述了数据预处理、网络架构设计、训练策略及优化方法,并展望了未来发展趋势。 ####
601 6
|
安全 搜索推荐 Android开发
深入探索Android与iOS的系统架构差异
【10月更文挑战第29天】 在当今的智能手机市场中,Android和iOS无疑是两大主流操作系统。本文旨在深入探讨这两个系统的架构差异,从底层的操作系统设计到用户界面的呈现,以及它们如何影响了开发者和用户的体验。通过对比分析,我们可以更清晰地理解这两种平台的优势与局限,为开发者在选择开发平台时提供有价值的参考,同时也为用户选择设备提供一定的指导。
558 2
|
缓存 负载均衡 算法
Linux内核中的进程调度算法解析####
本文深入探讨了Linux操作系统核心组件之一——进程调度器,着重分析了其采用的CFS(完全公平调度器)算法。不同于传统摘要对研究背景、方法、结果和结论的概述,本文摘要将直接揭示CFS算法的核心优势及其在现代多核处理器环境下如何实现高效、公平的资源分配,同时简要提及该算法如何优化系统响应时间和吞吐量,为读者快速构建对Linux进程调度机制的认知框架。 ####
|
缓存 安全 网络协议
Windows 安全基础——NetBIOS篇
Windows 安全基础——NetBIOS篇
725 4
|
数据可视化 项目管理
Mac 任务管理神器:三款高效软件大揭秘
在 Mac 的世界里,拥有一款好用的任务管理软件如同拥有贴心的私人助理。本文推荐三款超棒的 Mac 任务管理软件:板栗看板、Things 和 OmniFocus。板栗看板以其可视化看板和团队协作功能脱颖而出;Things 以简洁高效的界面和强大的提醒功能著称;OmniFocus 则适合专业人士,提供深度任务规划和高级过滤功能。无论你是团队成员还是个人用户,总有一款适合你,助你提升工作效率,让生活更加有序。