阿里发布AliGenie2.0系统,“百箱大战”用上视觉武器

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介:

天猫精灵X1的升级版X2没有预期出现,而人机交互系统AliGenie升级到最新的2.0版本,功能强大。

3月22日,阿里巴巴人工智能实验室总经理浅雪(陈丽娟)发布AliGenie2.0系统,它最大的改进是在1.0的基础上增加了视觉能力,并引入多模态交互能力,只需要另外增加一些辅助设备,就能让天猫精灵具备视觉能力。同时,浅雪还宣布,天猫精灵销量已经超过200万台。

四年前,亚马逊推出Echo,将AI音箱大战引发;去年,亚马逊又推出带屏幕的音箱Echo Show,音箱视觉化、屏幕化成为一种趋势。除了AliGenie2.0外,京东叮咚Play以及百度即将发布的“小度在家”都具备视觉能力,AI音箱终于要拼视觉了。

AliGenie2.0:增加图像识别、物体检测、人脸识别能力

去年5月,阿里人工智能实验室(AI Labs)发布天猫精灵X1,内置AliGenie1.0系统。

AliGenie1.0已经建立了超强的知识体系,在这个知识体系当中拥有1个亿的实体理解能力,构建了近10亿的关系。同时AliGenie1.0算法也在升级,阿里AI Labs发布了一个全新的序列标注模型,这个序列标注模型能解决有自动纠错的能力,可以帮助语音理解有更强的容错性。AliGenie还具备主动学习能力,每一次跟用户的交互过程当中,系统都会自动完善。

浅雪发布的AliGenie2.0系统,是在1.0的基础上形成具备视觉、语音等多模态交互能力的新一代的人机交流系统。它不仅会具备听觉能力,还有视觉能力和情感反馈能力。

其中,视觉能力中又分为图像识别、人脸识别、物体检测三大技术。

e59071efed5b5b0cf4ea5e8f30bc877f2dc78665

同时,阿里AI Labs还把语音能力和视觉能力进行了融合,形成多模态交互的过程,从而构建一个更聪明的人机交流系统。

浅雪认为,人机交互远远不仅语音,“我们觉得在未来人机交互不仅有听觉,还有视觉、嗅觉,以及有更强的情感反馈能力。”

阿里AI Labs去年在自然语言理解等方向投入诸多,并在去年10月宣布引入微软亚洲研究院首席研究员聂再清博士、谷歌 Tango 和 DayDream 项目技术主管李名杨博士。目前聂再清负责阿里AI Labs北京研发中心的各项研发工作,并重点突破知识图谱和自然语言理解这两个领域。李名杨任 AI Labs 机器视觉杰出科学家。

9a7dadc93b2dda0e8da0eb3c1f3786a480402f50

阿里AI Labs北京研发中心负责人聂再清

在接受专访时,聂再清表示,天猫精灵具备情景感知、主动学习能力。自然语言理解很大的难点是因为自然语言的多样性,一句话可能有无数的意思,这就需要通过大数据,让开发人员跟大数据的交互主动进行挖掘,主动找到路径让开发人员跟用户一起交互,把语言的各种意思都完善了,才能让机器听懂,这也是阿里AI Labs 技术上的优势。

阿里AI Labs做硬件的逻辑:亲手打造更懂跨界,AliGenie系统将来或开放

虽然天猫精灵X2没有发布,但更小巧尺寸的天猫精灵曲奇、天猫路由器、天猫魔屏 S1 无屏电视以及周边配件等诸多硬件同时亮相。

7c30bd12d2800b36971c4f188b46207f6912d1cf

623fcf1414fb7ac0760d3483bc1a6c3edcf87e13

阿里最擅长做平台,这次一口气发布多款硬件产品,并非要转变路线,其背后的逻辑非常现实:做硬件比软件难的多。

浅雪说,阿里AI Labs在做天猫精灵之前,就已经尝试跟行业的一些合作伙伴共同研发硬件,但在合作过程中碰到了非常多的挑战,毕竟软硬件这两个不同领域跨界合作,相互之间并不清楚里面存在的问题。

一般来说,如果自己只做服务、系统,交给第三方做硬件的话,不容易掌握品控、制造周期等环节,这也是AI Labs去年自己着手打造硬件的原因。

不过,阿里做平台的基因没有变。浅雪希望AliGenie这个系统将来做的更好,让硬件的合作伙伴可以做(相关产品),应用AliGenie这套技术。

013bcdd9481dd72ab5fd3a82804a56f68c79321b

此外,浅雪还宣布,现在天猫精灵的销量已经突破200万台。

百箱大战继续升级:增加视觉能力,实现更多场景

2014年亚马逊的Echo问世,点燃了AI音箱大战的导火索,谷歌Home、苹果的Home Pod以及国内的阿里天猫精灵、小米的小爱同学、猎豹AI音箱等纷纷入场;去年亚马逊发布带屏幕的音箱Echo Show,将AI音箱带入另一个竞争阶段:视觉化。

虽然这次天猫精灵并没有推出带屏幕的音箱,但AliGenie 2.0将视觉能力落地,推出了“精灵火眼”:外置一台XHolder(类似手机支架),放置装有天猫精灵手机APP的手机后,能够让天猫精灵具备视觉认知能力。

79b6e11ff56b3d3a078baf97e7e00768046647f6

这种做法类似当年谷歌在推出VR产品时,外设的Google Cardboard,能够在实现视觉功能的同时,最大限度节省成本。

但“友商”们更激进。在今年CES上,京东智能音箱叮咚Play亮相,这款产品配备了8英寸的液晶显示屏,能够实现视频通话、人脸识别等功能。百度近日也宣布,将在下周发布“小度在家”智能视频音箱。

进入2018年,视觉化、屏幕化让“百箱大战”进入到新的竞争阶段。与单纯的语音音箱而言,加入了视觉功能的音箱能够实现更多场景。以“精灵火眼”为例,阿里与出版业合作,通过图像识别书本后,“精灵火眼”能够实现智能语音互动、声音朗读,帮助儿童读书、识字,商业化空间巨大。


原文发布时间为:2018-03-23

本文作者:张乾

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:阿里发布AliGenie2.0系统,“百箱大战”用上视觉武器

相关文章
|
4月前
|
人工智能 自然语言处理 数据可视化
💼智能办公新风尚:AI如何让你的会议、报告秒变高大上?
【8月更文挑战第1天】在现代职场中,AI正革新会议与报告,使其高效且具创意。对于会议,AI通过实时翻译、语音识别、自动纪要及情感分析提升效率与质量。示例代码展示了概念性的会议纪要生成功能。而对于报告制作,AI利用数据可视化、内容自动生成与智能排版工具提高效率并激发创意。尽管直接展示复杂的NLG代码不易,但我们设想了一个基于API的服务来生成报告内容的过程。AI正深刻改变办公体验,未来智能办公将更加精彩。
44 0
|
7月前
|
人工智能 自然语言处理 计算机视觉
TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成
【2月更文挑战第3天】TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成
98 1
TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成
|
机器学习/深度学习 人工智能 编解码
|
机器学习/深度学习 人工智能 算法
腾讯AI单挑王者荣耀职业玩家,“绝悟”技术细节首次披露!
腾讯王者荣耀AI“绝悟”的论文终于发表了!“绝悟”制霸王者荣耀世界冠军杯、在2100多场和顶级业余玩家体验测试中胜率达到99.8%。腾讯AI Lab提出一种深度强化学习框架,并探索了一些算法层面的创新,对MOBA 1v1 游戏这样的多智能体竞争环境进行了大规模的高效探索。
1081 0
腾讯AI单挑王者荣耀职业玩家,“绝悟”技术细节首次披露!
|
5G Android开发 芯片
5G手机启示录:拒绝产品圈地,深耕基础体验
手机战事总是变化莫测,消费者会用脚投票。 9月,苹果发布了iPhone 11系列,业界一片唱衰不支持5G。安卓阵营,三星、华为、OPPO、小米、vivo等厂商均在全球有5G产品的推出,被寄予厚望。但市场给出的反馈恰恰相反,iPhone 11依然爆卖,而5G手机则有些雷声大雨点小。 为什么5G手机难敌4G?苹果CEO库克在iPhone11发布会后表示,整个市场无论是基础架构还是芯片都还没有足够成熟,不足以支撑推出一个高质量的产品。从消费者角度出发,不少用户认为当下的5G手机缺少突出功能,在市场和产品更成熟之前会持续观望。 这一结果也引发了行业思考:对于用户,真正需要的是最前沿的技术?
217 0
5G手机启示录:拒绝产品圈地,深耕基础体验
|
机器学习/深度学习 人工智能 自然语言处理
百度大脑十年丰绩大成:6.0全新发布,具备认知能力的终端虚拟人亮相
「智能时代的操作系统」飞桨和自研 AI 处理器百度昆仑都已就位,产业智能化时代正在到来。
159 0
百度大脑十年丰绩大成:6.0全新发布,具备认知能力的终端虚拟人亮相
|
Web App开发 人工智能 搜索推荐
思否技术周刊丨​字节跳动:公司将严格遵守条例、日本「飞行汽车」首次试飞成功、「仿人脑」人工智能开放平台在深发布
思否技术周刊丨​字节跳动:公司将严格遵守条例、日本「飞行汽车」首次试飞成功、「仿人脑」人工智能开放平台在深发布
思否技术周刊丨​字节跳动:公司将严格遵守条例、日本「飞行汽车」首次试飞成功、「仿人脑」人工智能开放平台在深发布
|
Cloud Native NoSQL 关系型数据库
对话李飞飞,揭秘国际体育赛事风“云”背后的黑科技
众所周知,在重大体育赛事中,如何提高运动员的成绩,如何改善观众的参与体验,是体育组织越来越重视的问题。那么阿里云技术是如何帮助解决这个问题的呢? 今天,我们有幸邀请到阿里巴巴集团副总裁、阿里云智能数据库产品事业部负责人、ACM杰出科学家李飞飞为我们揭秘国际体育赛事风“云”背后的黑科技。
1024 0
对话李飞飞,揭秘国际体育赛事风“云”背后的黑科技
|
机器学习/深度学习 人工智能 算法
一周AI最火论文 | 和机器人一起“云”健身,VR健身房助力人机交互
一周AI最火论文 | 和机器人一起“云”健身,VR健身房助力人机交互
235 0
|
机器学习/深度学习 人工智能 自动驾驶
公开下载 | 让刷剧更带感!“划时代”文娱体验背后有何技术较量?
AI弹幕、VR技术、5G超清......这在十年前可能都只是停留在人们想象中的文娱新体验,如今已经普及开来。如何让刷剧更“带感”?阿里巴巴文娱有答案!刷剧前下载,刷剧后阅读,8位阿里技术专家为你详解那些你不知道的智慧文娱关键技术!
18147 0
公开下载 | 让刷剧更带感!“划时代”文娱体验背后有何技术较量?