揭秘阿里人工智能实验室首款智能音箱——天猫精灵X1

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: 7月5日下午,阿里人工智能实验室在北京正式发布了旗下首款智能设备——天猫精灵X1,据介绍,这款产品采用了阿里人工智能实验室自主研发的中文语义理解引擎,内置第一代中文人机交流系统AliGenie,并且依托阿里云的机器学习技术实现智能家居控制、语音购物、手机充值、音乐播放等功能。
7月5日下午,阿里人工智能实验室在北京正式发布了旗下首款智能设备——天猫精灵X1,据介绍,这款产品采用了阿里人工智能实验室自主研发的中文语义理解引擎,内置第一代中文人机交流系统AliGenie,并且依托阿里云的机器学习技术实现智能家居控制、语音购物、手机充值、音乐播放等功能。

f57604173a770ffcc85108112a450d661a494319

以下是关于天猫精灵X1以及AliGenie的问答!

一、关于天猫精灵X1

Q:天猫精灵X1是什么?

A:天猫精灵X1是阿里人工智能实验室推出的首款智能语音终端设备,内置第一代中文人机交流系统AliGenie。AliGenie生活在云端,它能够听懂中文普通话语音指令,目前可实现智能家居控制、语音购物、手机充值、叫外卖、音频音乐播放等功能,带来崭新的人机交互新体验。依靠阿里云强大的机器学习技术和计算能力,AliGenie能够不断进化成长,了解使用者的喜好和习惯,成为人类贴心的智能助手。 

Q:能介绍一下阿里人工智能实验室吗?

阿里人工智能实验室(A.I. Labs)成立于2016年,负责阿里巴巴集团旗下消费级AI产品的研发。A.I. Labs的使命是探索人机交互新大陆,带领人们体验探索未知世界的乐趣。 

Q:阿里为什么要做天猫精灵X1?

A:语言是人与人之间最主要的沟通方式,也应该是人与另外一种智能进行交流的主要方式。我们认为随着云端一体化带来的高度智能化,智能终端需要匹配比手机触屏更强大的人机交互方式,AliGenie将肩负阿里巴巴在智能人机交流系统领域探索的使命。我们将为开发者和硬件厂商提供一个开发者平台,包括了语音技术、服务入口以及硬件方案,并整合阿里巴巴生态体系中丰富的互联网服务和商业链接能力,共同为消费者提供全新的智能体验。天猫精灵X1只是这个生态体系中新生长出来的一颗大树,我们希望未来能长出一片新的森林。

Q:为什么起这个名字,X1有什么意义吗?

A:在数学中,“X”代表未知数和变量。天猫精灵X1作为中国消费级AI产品的开端,充满着未知和变量。这也是阿里人工智能实验室推出的第一款产品,因此命名为X1。 

Q:天猫精灵X1目前有哪些功能?

A:目前已经具备音乐音频内容的播放、听故事、讲笑话、查运势、玩游戏、查天气、找手机、问百科、设闹钟/定时器、查食物热量、充话费、查快递、查价格、天猫魔盒控制、天猫超市购物、智能家电操控等功能。随着开发者的入驻,天猫精灵X1能够实现的功能还将快速增加,具体可以查看天猫精灵官方网站,或下载天猫精灵APP。

Q:天猫精灵X1的声音是怎么来的?

A:我们接触了100位专业声优,最后选择了我们最满意的这位。加上语音合成技术,这就是最后大家听到的回答,希望大家都能喜欢。另外,未来还会开放语音包接口。

Q:天猫精灵X1硬件配置如何?

A:天猫精灵X1采用了首颗专门为智能语音行业开发的芯片,在解码,降噪,声音处理,多声道的协同等方面做了专门的优化处理。针对AliGenie需要进行大量音频处理、声音合成的工作环境,定制芯片加入了独立的NEON处理单元,NEON 技术可加速音频和语音处理、电话和声音合成等,从而带来更优秀的语音识别及音频处理效果。

在收音方案上我们采用了业界公认的优秀方案------六麦克风收音阵列技术。在顶部的六颗高灵敏麦克风有助于收集到来自不同方向的声音,从而更容易在周围的噪音中识别出有用的信息,来达到更好的远场交互效果。 

Q:在有噪音的环境中也能正常使用吗?是如何做到的?

A:天猫精灵X1背后的团队在降噪技术上做了大量研究,并专门针对家庭使用场景做了优化。天猫精灵不是在绝对安静的环境下工作的,家庭中有各种各样的噪音,开发人员在厨房,客厅,卧室,书房等环境里面,对玻璃,木材,混凝土,金属,石材,等各种材质和环境进行了上千次实验,其中对中国家庭环境大量使用的石材和木头材质进行了针对性的测定,能够适应在家庭环境噪音下进行唤醒。并且具备一定的学习功能,可以根据环境噪音进行学习和进化,适应不同家庭环境噪音,经过7天左右优化,会更加适应所在家庭环境。

此外,天猫精灵X1还使用了回声对消和远近场拾音等技术,即使在播放音乐的同时也能正常接收语音指令。 

Q:什么时候正式发售?

A:天猫精灵X1于7月5日开始限量公测,用户和开发者可以在天猫精灵官网(bot.tmall.com)申请公测,8月8日将面向天猫会员用户进行首批正式发售。

Q:这个需要配套的手机APP吗?

A:在初次使用时,用户在手机上安装天猫精灵app,用以绑定账号。手机app可以实时显示与硬件产品的连接状态、命令接受反应情况、产品最新的功能上线提醒,以及主动推荐适合用户使用习惯的内容。

天猫精灵APP 7月5号就会在各大应用商店上线,X1的用户也可以通过“手机淘宝”------“我的设备”进入操作页面,可不必安装单独APP。 

二、关于AliGenie和开发者平台

Q:AliGenie目前所涵盖的功能包括?

A:目前有以下功能,随着更多功能的开发和第三方开发者的加入,功能将不断扩展

1. 音乐音频:海量曲库和内容库
2. 家居控制:语音控制智能家电设备
3. 购物充值:声纹实现购物全流程
4. 儿童教育:精选儿童音频内容,寓教于乐
5. 技能市场:汇聚各种服务和内容,不断扩展功能

Q:AliGenie未来还会进入哪些生活及商业场景?

A:目前已经或正在拓展的行业解决方案有1、儿童领域2、酒店领域3、家庭场景下4、TO B其他商业场景5、线下零售场景6、与其他显示设备结合的场景 

Q:AliGenie可接入的智能家电范围包括?

A:目前支持100多个品牌,包括接入阿里智能联盟、涂鸦科技、broadlink等智能家居方案的产品,更多智能家电正在接入中。 

Q:AliGenie开发者平台会开放哪些能力?

A:AliGenie开发者平台主要面向四种类型的开发者,包括内容开发者、应用开发者、智能家居开发商和硬件生产商。开发者既可以创建技能,为更多的语音用户提供服务,也可以将自己的设备接入云端服务,获取语音交互能力。

依托强大的底层技术、智能的算法引擎、完善的云端服务和成熟的软硬件标准系统,AliGenie会持续不断地将全面、易用的核心技术能力进行输出,为开发者带去更多可能。通过AliGenie开发者平台,开发者可以链接到阿里生态体系中的数亿消费者和海量的生活和商业场景。

Q:AliGenie开发者平台有哪些核心技术开放?

A:1、深度学习 
我们研发了国际领先的深度学习技术来作为AliGenie的大脑,这些技术成果被发表在顶尖国际会议例如KDD和CVPR上。我们自主研发的深度学习能快速高效的从海量数据中进行学习,并能在广泛的应用场景中使用。

2、自然语言处理 
基于我们积累的海量的自然语言数据,和自主研发的国际领先的深度学习技术,我们实现了高效准确稳定的自然语言理解。

3、搜索/推荐算法 
通过阿里积累的用户画像,为用户个性化地提供用户所需要的信息和内容服务。

4、知识表示及推理问答系统 
我们构建了一个海量的知识库,实现对万事万物的结构化的描述,这个知识库不仅帮助我们更好的理解语言,更重要的是可以通过推理回答各种知识类问题。 

上述能力我们将免费开放给开发者和硬件厂商,无需从头搭建AI语音系统,节省在研发上的巨量投入,使开发者能够更好的为用户提供服务。

Q:如何成为AliGenie平台上的开发者?

A:通过我们的开发者平台,即可申请成为开发者,只需要简单认证,就可以使用我们的深度学习训练平台。

1、通过官网进行注册,填写资料申请邀请码
2、一周内发放邀请码,开放相关工具和平台
3、可以利用平台进行相关的开发和应用,然后提交测试评审,通过后可以在应用商店上线 

Q:硬件厂商如何将AliGenie集成到自己的产品中?

A:我们会推出全套的硬件参考设计方案,给予合作伙伴足够的支持。

1、厂商通过官网申请合作文档和技术参考文档。
2、我们将对申请进行评估,并与合作伙伴讨论准备相关硬件的设计方案、接入方案及商业策略。
3、双方进行联合开发和测试,整个过程约1.5个月左右完成。 

Q:什么样的智能硬件可以与AliGenie连接?硬件厂商如何加入?

A:目前阿里智能联盟的上千万智能家居设备已经能够与天猫精灵X1进行连接。

硬件设备厂商可以通过两种方式接入AliGenie:

1.通过SDK接入
提供常用平台(如嵌入式Linux、Android)的SDK给到设备厂商,SDK中包含了如长连接通讯、设备用户绑定、音频播控、状态管理等功能模块,封装其中的实现细节,开发者可以方便的进行接入。

2.通过协议接入
提供基于Websocket的一套标准化协议,由厂商自行进行对接,直接调用AliGenie的各项能力。 

Q:开发者如何分成?

A:开发者可以获得全部收益,平台在推广期间不参与分成。我们还会推出相关的阿里AI创新开发者计划。 

三、关于技术

Q:这个产品是阿里自己研发的吗?有哪些核心技术?

A:天猫精灵X1和AliGenie均由阿里巴巴的科学家和工程师团队研发,应用了阿里巴巴积累多年的语音识别、自然语言处理、人机交互等技术。其中,阿里人工智能实验室正在对声纹识别、声纹购、NLP中文对话引擎等核心技术申请专利。不久前,我们的NLP技术团队还在国际权威技术论坛KDD 2017 上发表了一篇论文。 

Q:阿里巴巴在人工智能语音领域有何独到的技术优势?

A:在美国国家标准署2016年举办的全球说话人识别竞赛(NIST SRE2016),阿里巴巴以OpenSesame(芝麻开门)为队名,采用了基于深度学习网络的特征提取,借助距离测度学习来提高数据的泛法能力,开创性提出利用对称性支持向量机器来提高系统性能,在近两百多支参赛队伍中,阿里最后的系统性能在大中华区声纹识别性能排第一,美国赛区第二。同时我们递交了4个相关的专利,这一系统曾受邀在声纹识别顶级(NIST SRE2016 workshop)作公开演讲。 

在语音顶级国际会议Interspeech2017, 我们的两篇论文也被接受:《The Opensesame NIST 2016 Speaker Recognition Evaluation System》《The I4U Mega Fusion and Collaboration for NIST Speaker Recognition Evaluation 2016》。 

这一声纹识别技术也被运用到了X1上,它会根据声音条件识别出不同的使用者,以此保证使用的安全性和私密性。而在记住了每个人之后,X1还能够实现“千人千面”,能够根据每个人的喜欢进行内容设定和推荐。 

基于声纹识别技术,我们还推出了声纹购功能,是第一个商用的声纹购物系统,可以通过声纹完成支付,当你发起购物、充值等行为时,只需要说出声纹密码,声音识别系统将对身份进行校检,确认是本人后才会完成交易,否则将拒绝请求。 

Q:产品是否支持多轮对话?

A:支持。阿里巴巴人工智能实验室在自然语言理解的基础上,加入了“决策引擎”机制,能够理解语音的上下文语境,并判断当前应该响应的是哪一个模块,进行决策。这一套先进的人机交互和自然语言处理系统也在国际顶级学术论坛KDD 2017上发表了重要的论文,并正在申请技术专利。 

Q: X1的语义理解是用的自己的技术吗?做的怎么样?

A:中文语音交互的难点在于中文的语义理解。阿里人工智能实验室研发的中文语义理解引擎针对常用的定时,提醒,天气,娱乐内容,家居控制,助手,以及购物等领域进行了特别优化,仅天气预报就能够理解786种中文问法。

通过深度机器学习,天猫精灵X1已兼容20个领域的自然语义理解。

此外也更多考虑到中文语言对话过程中的各种实际案例,对北方语言的儿化音,干净利素的问法,小朋友经常叠字叠词,南方人某些与普通话混淆的中文表达方法进行了深度处理。针对中国人语言发音的特色,对吞字,咬字,缺字,北京话习惯,河南话习惯进行了特别优化,进行补偿和修正。
 
这套语义理解系统还带有记忆功能和强大总结归纳能力,还加入了模拟的“长期记忆”和“短期记忆”功能,能够针对不同的场景和时间度,让语义理解系统更加贴近用户。除此之外,阿里人工智能实验室还已经着手其他多个语种的研究。
目录
相关文章
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与未来教育:探索智能教学的新纪元
【10月更文挑战第16天】 在21世纪这个信息爆炸的时代,技术革新正以惊人的速度改变着我们的生活和工作方式。其中,人工智能(AI)作为引领变革的先锋力量,不仅重塑了工业、医疗、金融等多个行业的面貌,也正悄然渗透进教育领域,预示着一场关于学习与教学方式的革命。本文旨在探讨人工智能如何为未来教育带来前所未有的机遇与挑战,从个性化学习路径的定制到教育资源的优化分配,再到教师角色的转变,我们一同展望一个更加智能、高效且包容的教育新纪元。
|
4月前
|
机器学习/深度学习 人工智能 自动驾驶
智能新纪元:人工智能在现代社会的角色与挑战
随着科技的飞速进步,人工智能(AI)已从科幻小说的幻想步入我们的现实生活。本文将深入探讨AI在各行各业中的应用,分析它如何重塑我们的工作和生活方式,同时也会触及伴随这一技术发展而来的伦理、隐私和就业等挑战。通过具体案例,我们将一窥AI技术的未来可能性及其对人类社会的深远影响。
|
15天前
|
人工智能 安全 算法
上交大、上海人工智能实验室开源首个多轮安全对齐数据集 SafeMTData
最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称,推理可以让模型更好的遵守安全政策,是提升模型安全的新路径。
|
2月前
|
传感器 数据采集 机器学习/深度学习
人工智能与环境保护:智能监测与治理的新策略
【9月更文挑战第21天】人工智能在环境保护中的应用,为智能监测与治理提供了新的策略和方法。通过实时数据采集与分析、智能预警与应急响应、精准化决策支持等技术的应用,AI正在引领一场革命性的变革。未来,随着技术的不断发展和应用场景的拓展,AI将在环境保护中发挥更加重要的作用,助力我们构建更加绿色、可持续的未来。让我们携手共进,共同迎接一个更加美好的明天。
|
9天前
|
人工智能 监控 物联网
深度探索人工智能与物联网的融合:构建未来智能生态系统###
在当今这个数据驱动的时代,人工智能(AI)与物联网(IoT)的深度融合正引领着一场前所未有的技术革命。本文旨在深入剖析这一融合背后的技术原理、探讨其在不同领域的应用实例及面临的挑战与机遇,为读者描绘一幅关于未来智能生态系统的宏伟蓝图。通过技术创新的视角,我们不仅揭示了AI与IoT结合的强大潜力,也展望了它们如何共同塑造一个更加高效、可持续且互联的世界。 ###
|
3月前
|
人工智能 监控 算法
智能时代的伦理困境:AI技术的道德边界探索人工智能在教育领域的革新之路未来编程:人工智能与代码共生的新篇章
【8月更文挑战第21天】在人工智能(AI)技术飞速发展的今天,我们正处在一个前所未有的科技变革时期。随着AI技术的深入人类生活的方方面面,它不仅带来了便利和效率的提升,同时也引发了关于道德和伦理的深刻讨论。本文将探讨AI技术发展中遇到的伦理挑战,以及如何建立合理的道德框架来指导AI的未来应用,确保技术进步与人类社会价值观的和谐共存。
245 61
|
1月前
|
机器学习/深度学习 移动开发 自然语言处理
基于人工智能技术的智能导诊系统源码,SpringBoot作为后端服务的框架,提供快速开发,自动配置和生产级特性
当身体不适却不知该挂哪个科室时,智能导诊系统应运而生。患者只需选择不适部位和症状,系统即可迅速推荐正确科室,避免排错队浪费时间。该系统基于SpringBoot、Redis、MyBatis Plus等技术架构,支持多渠道接入,具备自然语言理解和多输入方式,确保高效精准的导诊体验。无论是线上医疗平台还是大型医院,智能导诊系统均能有效优化就诊流程。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
智能新纪元:人工智能如何重塑我们的未来
想象一下,未来的世界被一种无形的智能所包围,它不仅理解我们的需求,还能预测我们的欲望。这不是科幻小说的情节,而是人工智能(AI)技术正在逐步实现的愿景。本文将带你一探AI技术的最新进展,以及它是如何悄然改变我们的生活、工作和思维方式。从深度学习到自然语言处理,我们将一同见证这场科技革命如何开启智能新纪元的大门。
|
2月前
|
机器学习/深度学习 数据采集 人工智能
智能化运维的探索之旅:从自动化到人工智能
在数字化浪潮中,运维领域正经历一场革命。本文将带你领略从传统手动操作到自动化脚本,再到集成人工智能的智能运维平台的演变之路。我们将探讨如何通过技术创新提升效率、降低成本并增强系统的可靠性和安全性。文章不仅分享技术演进的故事,还提供了实现智能化运维的实践策略和未来趋势的展望。
|
3月前
|
机器学习/深度学习 人工智能 自动驾驶
探索人工智能的未来应用:从智能助手到自动驾驶
【8月更文挑战第30天】 在本文中,我们将深入探讨人工智能(AI)的未来应用,从智能助手到自动驾驶。我们将看到AI如何改变我们的生活,并讨论其潜在的影响和挑战。让我们一起探索这个令人兴奋的领域吧!
70 1

热门文章

最新文章

下一篇
无影云桌面