百度DuerOS+ARM 加出了赋能合作伙伴的哪些能力?

简介: 11月6日,以“Architect the Possible”为主题的2017 ARM年度技术研讨会(Arm Tech Symposia 2017 China)在上海率先开幕,除了安创空间、华为等ARM同芯片直接相关的“老伙伴”如约参加,会上还出现了开放AI的OS厂商身影。

11月6日,以“Architect the Possible”为主题的2017 ARM年度技术研讨会(Arm Tech Symposia 2017 China)在上海率先开幕,除了安创空间、华为等ARM同芯片直接相关的“老伙伴”如约参加,会上还出现了开放AI的OS厂商身影。


百度度秘事业部总经理景鲲演讲时展示的DuerOS智慧芯片,吸引了现场观众的强烈兴趣。他表示,百度DuerOS与ARM已达成战略合作,双方通过强强联合,将为更多合作伙伴赋能。接下来, DuerOS将与更多合作伙伴一起,把百度的AI能力集成到每个DuerOS智慧芯片里面,使软硬件结合更简单。


景鲲的讲话集中在智能语音对话领域,而事实上,DuerOS作为为数不多的人工智能开放平台,现在强调与上游硬件商强强联合,推出以智慧芯片为主体的Turnkey解决方案,反映的是以DuerOS为代表的人工智能开放平台们要为全产业赋能的雄心。


c49e725eb2a419b52e3295efffc2acb7.jpg



做OS? 巨头们的强强联手或许更靠谱

景鲲“谦虚地”拉来了Amazon Alexa、Google Assistant、Apple Siri、Microsoft Cortana这四家同样做人工智能语音交互的厂商做对比,而实际上,真正在开放性方面能和DuerOS并肩的可能只有Amazon Alexa以及Google Assistant。


Alexa除了卖爆了的Echo智能音响,还通过允许第三方开发者在该平台上开发各种基于语音的技术功能,成功渗透到了汽车、电视服务、LED灯、蓝牙耳机、智能家居等领域。

Google Assistant本来是“自娱自乐”的产品,看见Alexa的成功后着了急,去年12月开放给IFTTT、三星、飞利浦和Nest等第三方开发者在家用电器方面进行合作,以追赶Amazon的脚步。


如今,百度DuerOS与ARM已达成战略合作,双方通过强强联合,将为更多合作伙伴赋能。接下来, DuerOS将与更多合作伙伴一起,把百度的AI能力集成到每个DuerOS智慧芯片里面,使软硬件结合更简单。


作为全球领先的半导体知识产权 (IP) 提供商,ARM在IoT领域有着非常大的优势,人工智能是其投入研发的重要领域之一。而DuerOS是百度AI技术的集大成者,在技术、数据和资源方面处于国内智能语音领域领先地位。此次二者强强联合,将会为生态合作伙伴提供先进的对话式人工智能turnkey解决方案,让可对话智能设备的技术和应用门槛更低。


从合作上看,DuerOS与ARM合作,一个输出自己在智能人机交互上的能力,一个在半导体知识产权 (IP)上有深厚积累,这样的合作为行业赋能的能力将大大加强。景鲲介绍说,DuerOS智慧芯片搭载了DuerOS对话式人工智能系统,赋予芯片可对话的功能,采用了ARM公司mbed内核及安全网络协议栈,实现了与云端的安全连接,降低了设备商应用开发门槛。同时,还集成了紫光展锐的RDA5981,该芯片具有低功耗、低成本的特点,并提供丰富的IO接口,支持Wi-Fi/蓝牙多种连接模式。


从诞生之初,百度DuerOS就希望希望将领先的AI技术和丰富资源输出给行业合作伙伴,共同打造极致的语音交互体验。如今,DuerOS有了ARM的“加持”,全球领先的智能人机交互平台和全球领先的半导体知识产权(IP)提供商强强联手,无疑会让智能语音行业的软硬结合更简单,为更多合作伙伴赋能。


DuerOS要做的,也许和当年Android要做的类似。

0bfb16c972c1a51b8a1cab9da2bcdc73.jpg



商业化这条路上,中国AI更有前瞻性

正如李开复所说,人工智能最终需要寻找到落地的领域和方式。说白了,百度DuerOS、阿里YunOS、Amazon Alexa、Google Assistant做全产业链的目的,无非是为了更好的商业化。而这一次,同互联网普及一样,“国产货”百度DuerOS、阿里YunOS的前瞻性已经超过欧美国家。

1硬件在人工智能生态中的作用已经超过应用层

来看看百度的数据。目前为止,百度DuerOS在支撑人工智能的数据上,已经拥有千万级的用户画像细分标签,亿级的多轮对话请求、全球POI总数、每日导航公里数,十亿级的知识图谱实体、语音调用、音频,百亿级的搜索请求、视频,千亿级的图片,万亿级的网页。

如此庞大数据代表什么?应用层面所需的“底料”已经足够丰富,针对这些底料的挖掘工作也已经实现了某种常态化。


对于百度、阿里、腾讯这样的巨型互联网公司来说,PC时代,微软制定了操作系统标准,它们的软件直接应用即可,不需要和电脑厂商谈判;移动互联网时代,Andriod、iOS让微信这些APP直接上线即可,不需要同小米、魅族、华为去商讨;而万物智能时代,已经没有这样的基础。百度一方面要做的是抢占Windows、Andriod、iOS的角色,另一方面又不得不在全新的非标准化硬件上面临DuerOS落地的问题,数据丰沛之后,硬件层面的缺乏显露出来。


由此,在人工智能生态的构建中,硬件已经取代应用层面成为野心家们实现商业化落地最重要的环节,这也是百度迫不及待同ARM、RDA这些厂商深度合作的原因,要让非标准化的万物互联在任何承载的硬件上都能随时随地“AI一下”,而不是每个案例都要去找消费电子厂商合作一次,那样的生态必然是失败的。

2三赢更能保证人工智能产业化落地

景鲲在大会演讲中对DuerOS与ARM、RDA、汉枫合作的智能芯片阐述了一系列技术要点,不妨从商业角度用浅显的语言来解读一下:


DuerOS被集成至智能芯片,硬件层面的实现速度更快;ARM提供“mbed内核以及安全协议栈”,说白了就是了通用内核,开发上实现底层的一致性,大家说同样的话,没有沟通障碍;RDA5981是芯片的本体,作用是ARM内核之上的“插线板”,起到桥梁作用,同时DuerOS引入了直接面对智能玩具、智能家居、便携音箱等多种场景应用的汉枫Wifi模组HF-LPB200U,“插”在“插线板”上,至此,从内核到面对场景全覆盖,DuerOS的智慧芯片做到了“拿来就能用”。


景鲲自己也将DuerOS智慧芯片的价值形象地概括成“三低、三高”。“三低”指的是低成本、低门槛、低消耗。首先是低成本,即拥有低价格、低开发成本、低接入成本;第二是低门槛,也就是无需非常复杂的专业技术、无需精通AI领域知识、简单代码知识即可应用;第三是低消耗,语音高压缩比(1/16),即开即用,适应范围广。“三高”指的是高安全、高集成、高附加。首先高安全方面,智慧芯片采用了ARM公司的mbed内核以及安全协议栈,实现端到端的安全连接;第二在高集成方面,完美集成RDA5981芯片、mbed、HF-LPB200U模组,从WIFI到窄带蜂窝环境都能支持;第三是高附加,支持语音识别、语音播报,支持70+人工智能功能、支持DuerOS大脑技术。现在,DuerOS智慧芯片已接入智能玩具、智能小家电、智能音箱以及智能穿戴等多品类设备中,并将无处不在。


正如买一辆汽车,买来就能开,不必自己买发动机、车身、轮胎。而想刷更漂亮的油漆、换高档的内饰这些是用户自己去折腾的事。DuerOS的智慧芯片已经实现了AI语音交互的基本功能,开发者只需要聚焦于交互设备(音响、话筒、电池等)、外壳等功能性开发等即可,这便是景鲲所谓的Turnkey解决方案由来。


为什么要费劲做这样一个解决方案?对DuerOS来说,上文所提的标准化承载得到解决,而且通过Turnkey方案,百度有了同终端厂商“谈生意”的资格,联想、海尔、美的、小鱼在家等家电厂商皆成为合作伙伴。


对于ARM、RDA和汉枫来说,搭上百度的“大船”,显然更容易找到终端消费电子系统厂商使用自己的内核和硬件;而对消费电子厂商来说,人工智能拿来就能用,百度带来的品牌效应和宣传能力让自己的产品快速获得知名度,何乐而不为?


应用层的DuerOS,硬件层的ARM、RDA和汉枫,消费电子厂商都能找到自己的需求,这种三赢局面无疑才是人工智能产业化落地最好的态势。

3技术不足,但AI商业化未必

一方面,不得不承认Google这些西方公司的人工智能底层技术积累超越中国太多,但另一方面,如同互联网基础层被西方把持的情况下,中国的互联网应用繁荣程度却公认超越西方一样,中国AI的商业化无论在思路上还是实践上都可以超过西方。


Google的阿尔法狗引爆了人工智能热点,ZERO又再进一步不吃棋谱即远超前辈。然而,Google有阿尔法狗这样的新奇特和科技不断吸引全世界的眼球,但商业化大都停滞。百度一搞无人驾驶就弄出Apollo联合了开发者和汽车厂商,而Google的无人驾驶既不太愿意把技术拿出来共享,传统汽车厂商也不放心将技术依附于Google。同时,Google还寄希望于收购来实现商业化,一口气把7 家机器人公司(包括著名的波士顿动力)收入囊中,但这些收购来的项目商业化并不成功,大多都半路夭折。Amazon好不容易基于Alexa推出爆款Echo,中国的智能音箱已经遍地横行,DuerOS的“大买卖”已经做到了所有可以语音交互的硬件上,大量消费电子厂商已经积极加入进来。


说来说去,被人认为是行事浮躁、追求利益风口的中国互联网公司却顺势生出了某种实干的作风,而谷歌这些西方科技企业变得越来越庞大的时候,随之而来的却是越来越多无效的创新和收购。


b370b302cf0dc32abf6e4db816f5ed44.jpg




链接硬件&落地产品,产业链生态不是说说而已

DuerOS、YunOS一般都被拿来与Andriod对比。当年Google率先推出Andriod布局移动互联网现在已成为占有率最高的操作系统,是Google移动互联网生态最重要的模块。Google自然不是慈善家,在Andriod中加入Google Play、搜索引擎等自家产品,做成移动互联网的流量入口。


DuerOS与YunOS做全产业链的目的,直白地说也是要把OS打造成正在发生的人工智能IoT时代(相对于移动互联网时代)的流量入口。


然而,移动互联网时代与人工智能IoT时代毕竟不同,真的要做还存在着特殊的问题。

1底层标准化,但开发需要个性化

安卓系统主要面对智能手机一个产品,由独立来源的CPU、内存、显示屏、触摸板等标准化模块构成,Google开发一个版本,各硬件厂商拿去自己二次开发一下就上马,除了体验的些许差别,总归不会有太大偏差。


而IoT的种类十分复杂,靠一款通用的操作系统来满足不同IoT的需求目前来看几乎是不可能的,DuerOS、YunOS等做智慧芯片实现了底层的一致性和基础功能,但对比Android,除了开发厂商和开发者,还有芯片、模组授权、方案公司等复杂的产业涉及面,操作系统并不能一给了之,所有者还负有协同开发的任务,这是根本不同。


DuerOS与小鱼在家(一款视频对讲机器人产品)进行的深度合作就投入了两个团队的力量,这不仅是对硬件、对开发者的态度,本质上也是IoT操作系统的必须。阿里YunOS也与合作伙伴一起基于各自需求进行系统深度定制化开发,而这些,并不是Andirod的内容。


回过头来说,DuerOS要做全产业链也是协同需求的结果,只有上至芯片,下至消费产品的实现全部“包揽”,面对复杂IoT的操作系统才能做好协同,真正成为抢占AI设备的流量入口,而移动互联网的Andriod布设并不需要这样从硬件到产品的过程。

2技术解决后,商业化权衡浮出水面

一旦硬件、OS、产品的全产业链被掌握,各环节被打通,技术层面就只剩下不断优化提升、迭代的问题了。这时候,回归商业化的属性思考全产业链布局就很有必要。


DuerOS这些平台做全了产业链,推出了拿来就用的智慧芯片模组,门槛降低一方面确实能使真的想做精品的开发者受益,另一方面却可能造成各种阿猫阿狗乌泱泱一窝蜂都上的情况。


过去智能家居的教训就在于此,一些产品并非从用户需求和场景出发,为了“智能”而强行“智能”,最后烧完投资人的钱就撤退,令人唏嘘。只有那些真的解决了用户需求的产品才发展得较好,例如车载OS、可穿戴设备等。


解决这个问题,对OS平台方来说,开放的基础上也存有审核的社会责任,对共享者是否是一窝蜂的那一批得有分辨能力。而开发者也不能因为有了基础架势就盲目投入,OS促进了AI的商业化,但不是创业的万能灵药。


70296bc1694fd48f42d54c659fc19fe1.jpg


3群雄并起,开放兼容首次出现在OS之中

不可否认,不同于PC、移动互联网发展的早期,后知后觉的人和企业占主流,而当下,但凡有一些嗅觉的人都知道人工智能IoT时代的到来,都在积极布局。


这个市场太大,产品种类太多,每一种的数量又很庞大,最终的格局不会是像智能手机的Andriod、iOS就只有一两家争雄,大家在应用层面互不承认,无法兼容。


即便先知先觉的百度DuerOS能够占据市场先机,取得领先地位,这个市场最终仍将充斥着各种整合产业链的OS,一两家想要大一统或者平分秋色基本无可能。这就出现一个问题,采用不同开放人工智能OS的IoT之间如何相互开放?


在浩如烟海的IoT市场中,消费者很容易购买到分属不同OS的人工智能IoT,如果OS间不能开放兼容,最终的结局是消费者整体的不智能。因此,至少,在同一种内核(例如ARM)基础上做到竞争之下的包容很有必要。例如,DuerOS系统可以实现Alexa设备的快速接入,用17行代码即可兼容下Amazon的OS产品。


这就要求各OS平台在打造自己的全产业链生态时,从技术和商业的角度“略微”考虑下市场兼容情况。不过,这种兼容,除了技术、商业要求,恐怕最需要的还是胸襟。


相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
6月前
|
NoSQL Linux 开发工具
百度搜索:蓝易云【VSCode+GDB+Qemu调试ARM64 linux内核教程。】
请注意,根据你的具体环境和需求,上述步骤可能会有所调整和修改。建议参考相关文档和资源,以获得更详细的配置和调试指南。
93 0
|
人工智能 语音技术
百度DuerOS硅谷公布普罗米修斯计划,100万美金基金吸引AI才俊
百度DuerOS在硅谷GSVlabs正式宣布启动普罗米修斯计划。据介绍,普罗米修斯计划包含开放超大规模对话式AI数据集、跨学科合作等多种计划,以及一个100万美元的基金用以鼓励和培养对话式AI领域的优秀项目和人才。
1522 0
|
新零售 人工智能 机器人
百度AI大会的一些想法,了解DuerOS、Amazon Alexa和Echo
今天看了一会百度的AI开发者大会视频,说实话被一些场景震撼了,尤其是一位嵌入式工程师,利用百度AI,将小外甥的乐高机器人,打造为可对话的机器人,让我体会到AI就是身边,不再听起来像天方夜谭,我也有一些朋友做AI,简单聊了聊,这是个趋势,而且无论大厂和小厂,BAT以及科大讯飞,已经有一些成型的产品,但一些细节其实值得玩味。
1782 0
|
6月前
|
存储 Kubernetes 容器
百度搜索:蓝易云【Kubernetes使用helm部署NFS Provisioner】
现在,你已经成功使用Helm部署了NFS Provisioner,并且可以在Kubernetes中创建使用NFS存储的PersistentVolumeClaim。
202 10
|
6月前
百度搜索:蓝易云【什么是HTTP长轮询?】
现在,HTTP长轮询逐渐被WebSocket等更高效的实时通信技术所替代,但了解HTTP长轮询仍然有助于理解实时数据推送的基本原理。
126 9
|
6月前
|
移动开发 Shell Linux
百度搜索:蓝易云【Shell错误:/bin/bash^M: bad interpreter: No such file or directory】
将 `your_script.sh`替换为你的脚本文件名。运行此命令后,脚本文件的换行符将被转换为Linux格式,然后就可以在Linux系统上正常执行脚本了。
73 8
|
6月前
百度搜索:蓝易云【ipmitool配置BMC的ip】
以上操作将配置BMC的IP地址为新的值。请注意,操作BMC需要谨慎,确保你对服务器有足够的权限,并且仔细检查新的IP地址、子网掩码和默认网关,以免导致服务器网络失联。
101 7
|
6月前
|
Kubernetes 应用服务中间件 nginx
百度搜索:蓝易云【使用Kubernetes部署Nginx应用教程】
现在,你已经成功在Kubernetes集群上部署了Nginx应用。通过访问Service的外部IP地址,你可以访问Nginx服务。
82 4
|
6月前
|
缓存 网络协议 Linux
百度搜索:蓝易云【解决github push/pull报错443】
通过以上方法,你有望解决GitHub push/pull报错443的问题。如果问题仍然存在,建议检查GitHub的状态页面,看是否有正在维护或故障的情况。
133 3
|
6月前
|
Linux Perl
百度搜索:蓝易云【Linux常用命令awk】
以上仅是awk命令的一些常见用法,它还有许多更复杂的功能和用法,可以根据需要灵活运用。awk在文本处理和数据分析中非常实用,是Linux系统中的一把利器。
55 2
下一篇
无影云桌面