智能语音成家电前沿标配 做成中文 Alexa 的三个关键点

简介:

3月初,2017年AWE在上海落下帷幕,人工智能技术成为其中最大亮点,家电智能化已经从最初的“联网”和“APP化”逐渐转向语音、图像、手势控制,智能化程度明显升级。

2016年,人工智能迎来第三次爆发,而智能语音作为AI技术中成熟度比较高的产业已经实现了从技术到产品的真正落地。从亚马逊Echo到谷歌GoogleHome,从美国CES到中国AWE,智能语音已经成为智能家居中产品的前沿标配。

亚马逊Alexa以开放的生态,令Echo对用户的反馈日益人性化,成为众多智能硬件首选的“智慧大脑”。不过,纵观国内的智能语音技术提供商,中文版Alexa整体方案供应仍然稀缺。

智能家居时代 巨头积极布局语音交互

2014年11月,亚马逊发布第一代智能音箱Echo,推出两年累计销量超过600万台,成为引领人机交互进入智能家居“无屏时代”的标杆,一举成为最有潜力的智能互联开放平台,是美国使用最广的智能家居产品。随后,谷歌在2016年推出搭载两麦克风的GoogleHome,被认为可能是Echo强有力的竞品。

而苹果在智能家居方面的野心显然并不比亚马逊和Google低。苹果早就积极布局智能家居,推出Homekit。苹果HomeKit生态同样也非常强调智能语义技术,积极打通家居自然语音交互:让Siri与智能设备相连,替代遥控器与APP。

从巨头积极布局智能家居中的应用来看,在家庭环境场景下(远距离、无屏幕),语音将成为一大重要入口,而软件和硬件的结合则是必然趋势。

亚马逊Alexa的优势体现在其拥有系统开放的智能家居生态,将Alexa作为平台开放给第三方(包括服务提供方和设备制造商)、提供整套API和开发工具等举措吸引大量智能家居软件开发人员和硬件制造商参与新技能开发,形成了充满创造性的生态体系。

而GoogleHome除了可以控制整个家居环境的设备,也可设置家庭待办事项和购物清单等,具备双向通话能力。以Google强大的搜索数据库和海量的移动用户(主要是Android)为后盾,Home或比Echo更能精确地“体察”用户的喜好并给予更有针对性的反馈。

  家居智能化的关键点:软件和服务

笔者注意到,虽然国内外搭载智能语音的产品颇多,但真正能提供Alexa这样人工智能系统(AIOS)整套解决方案的供应商仍是凤毛麟角。比如在2017年CES上,包括三星、联想、LG在内的多家厂商都推出了不同类型的家庭智能设备,这些设备都内置了亚马逊Alexa。而在国内2017AWE上,我们同样看到国内的家电制造商如海尔(智能音箱)、格力(金贝空调)、美的(智能王空调、智能冰箱)等都选择与云知声合作进行家电智能化的落地(如采用云知声AIOS@Home智能语音交互整体解决方案)。

什么原因使得整个市场上能提供类似于Alexa或AIOS@Home这类整体解决方案的供应商如此稀缺?

笔者分析,主要是因为在智能家居领域的AI技术,其完整技术方案的门槛非常高,绝对不仅仅只是提供一两个算法或技术模块就可以被广泛采用的。一套完整的类似Alexa或AIOS@Home的方案至少需要做到以下三点才能被行业接受:

1.感知能力:软硬一体化方案

家居环境要求硬件产品必须能够实现在室内较远距离下(5米左右)灵敏感知用户的能力,这就要求不仅技术方案要实现语音识别、语音唤醒、语音合成等通用技术,还需要与麦克风阵列技术进行结合,具备远场语音交互能力;而智能家居产品对功耗和性能的苛刻要求则必须保障语音算法的极致优化,而且要和芯片进行深度结合,同时对本地化处理语音的速度和精确度也有极高的要求。这几项都需要供应商具备软硬一体的产品级解决能力。

目前在国内智能语音领域,拥有软硬一体化开发能力的方案提供者只有寥寥几家,比如科大讯飞、云知声等,竞争力主要体现在谁有能力打造低成本高性能、具有可订制性及赋能空间的软硬一体化方案。

2.认知能力:赋能家居拥有不断进化的自然语言交互能力

感知能力是基础,它提供了听见用户的能力,但仅仅“听见”是不够的,认知能力才能真正让智能家居产品拥有“智慧大脑”,可以听懂,甚至去决策执行。类似Alexa或AIOS@Home的整体方案必须包括语义理解、知识图谱等核心技能。这些技能让家居产品可充分理解用户的意图、与用户进行多轮对话、执行用户的操作、给予用户恰当的反馈等,是智能语音产品功能性和体验感的重要砝码。

当然,仅靠这些技能是不够的,用户需求的千差万别、不断变化,而且即使同一个需求,每个用户的习惯和偏好也都有很大不同,所以还需通过强大的机器学习能力和云端服务,对用户进行画像,分析用户习惯、喜好,从而为用户提供差异化和个性化的服务,不断升级技术的智慧程度。

3.生态能力:实现万物互联,系统构建智能家居生态

让家居设备与用户语音交互,只是第一步。智能家居的实用性体现在其可以真正解决用户的需求,为用户提供服务。Alex或AIOS@Home解决方案都提供了双向的平台:服务端提供平台接入各类第三方服务,而设备端可以对接到如智能家居中控、智能音箱、机器人等各类形态。这样它们不仅可以控制家电,还可以作为O2O入口,无缝链接购物、订餐等服务,成为智联硬件与服务的平台。为实现这一点,要求方案提供者拥有人工智能与物联网服务平台的双重能力,可从智能家居整体生态的格局出发,为家居搭载人工智能物联网方案,建立以用户为核心的智慧生活体系。

正确的业务方向各有不同。国内的供应商里,百度语音主要面向的是通用领域,而且缺少家居垂直领域类似多麦克阵列技术这样的软硬结合完整方案。而云知声AIOS是国内首先切入智能家居领域并实现落地出货的企业,科大讯飞AIUI也拥有不少电视领域的合作伙伴,这两家在国内可以说软硬件实力都比较齐备,而且技术实力不相仲伯。

在2016年底,包括李彦宏、李开复在内的众多大佬一致预测,2017年将是AI与产业结合前所未有紧密的一年。智能家居,未来已来

本文转自d1net(转载)

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
文字识别 安全 API
使用OCR服务时,如果出现HTTP 401错误
使用OCR服务时,如果出现HTTP 401错误
623 2
机票分享第六篇 机票搜索系统演进的经验
机票业务非常复杂,我们不得不应对这些复杂,也不断的想出一些招数演进系统。我回顾所做的事,再次思考并归纳核心思路,完成了本篇。 一、最大化统一,最小化变化 业务复杂,更不能随意新增接口、流程,思考如何将不同场景的流程融合在一起。
2847 0
|
SQL 关系型数据库 数据库
【玩转DB2】二、DB2联邦详细操作和踩坑
建立联邦(建立数据库与数据库联系与问题) 有问题可以找小可玩,评论留言。什么是联邦??建立和另外一个库的关系,换句话说就是我可以在这个库查到另外一个库的表。 本地库连目标数据库1、登陆本地服务器数据库 切换到对应的用户:su - 本地库用户名 连接本地库:db2 connect to 本地库 user 本地库用户名 using 本地用户密码 2、开启联邦支持开启联邦支持,查看数据库管理配置文件,FEDERATED属性 db2 get dbm cfg 如联邦属性为NO, 则需开启属性,重启数据库。
4697 0
|
Oracle 关系型数据库 网络安全
sqlnet.ora
一、例子 1、SQLNET.AUTHENTICATION_SERVICES= (NTS)    NAMES.DIRECTORY_PATH= (TNSNAMES,HOSTNAME)    客户端就会首先在tnsnames.
1295 0
|
安全 物联网 物联网安全
物联网安全拔“牙”实战——低功耗蓝牙(BLE)初探
0x00 目录 0x00 目录 0x01 前言 0x02 BLE概述    BLE 协议栈总览    GAP-通用访问规范    GATT-通用属性协议 0x03 BLE嗅探 0x04 伪造BLE通信 0x05 分析BLE私有数据协议(灯泡、跳蛋、小米手环)    1.
2864 0
|
4天前
|
缓存 人工智能 自然语言处理
我对比了8个Claude API中转站,踩了不少坑,总结给你
本文是个人开发者耗时1周实测的8大Claude中转平台横向评测,聚焦Claude Code真实体验:以加权均价(¥/M token)、内部汇率、缓存支持、模型真实性及稳定性为核心指标。
|
22天前
|
人工智能 数据可视化 安全
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
本文详解如何用阿里云Lighthouse一键部署OpenClaw,结合飞书CLI等工具,让AI真正“动手”——自动群发、生成科研日报、整理知识库。核心理念:未来软件应为AI而生,CLI即AI的“手脚”,实现高效、安全、可控的智能自动化。
34932 57
王炸组合!阿里云 OpenClaw X 飞书 CLI,开启 Agent 基建狂潮!(附带免费使用6个月服务器)
|
16天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
15271 44
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
11天前
|
人工智能 JavaScript Ubuntu
低成本搭建AIP自动化写作系统:Hermes保姆级使用教程,长文和逐步实操贴图
我带着怀疑的态度,深度使用了几天,聚焦微信公众号AIP自动化写作场景,写出来的几篇文章,几乎没有什么修改,至少合乎我本人的意愿,而且排版风格,也越来越完善,同样是起码过得了我自己这一关。 这个其实OpenClaw早可以实现了,但是目前我觉得最大的区别是,Hermes会自主总结提炼,并更新你的写作技能。 相信就冲这一点,就值得一试。 这篇帖子主要就Hermes部署使用,作一个非常详细的介绍,几乎一步一贴图。 关于Hermes,无论你赞成哪种声音,我希望都是你自己动手行动过,发自内心的选择!
2964 28

热门文章

最新文章

下一篇
开通oss服务