天猫精灵AliGenie-技能开发体验

简介: 以往,对于天猫精灵的理解,更多的是居于方糖音响产品。然而,它的语音交互功能才是王炸,尤其是在可以自定义交互语言的情况下!以下便是基于开发者平台展示的简单操作,此次展示的是作为个人使用,因此完全可以零基础操作。

一、简介
1.1 天猫精灵
天猫精灵(TmallGenie)是阿里巴巴集团阿里云智能事业群于2017年7月5日发布的AI智能终端品牌。让用户以自然语言对话的交互方式,实现影音娱乐、购物、信息查询、生活服务等功能操作,成为消费者的家庭助手。
当然,详细了解还是需要到官网进行了解,并且更加具有代入感。
官网:天猫官网
07.png
1.2 天猫精灵AliGenie开发者平台
AliGenie开发者平台是阿里巴巴人工智能实验室(AI-Labs)面向软硬件厂商和开发者推出的,将人工智能中ASR语音识别、NLP自然语言处理、TTS语音合成等自然语言处理技术和能力对外共享的开放式平台。
平台针对不同类型的开发者提供了丰富的开发工具,协助开发者完成语音技能的开发、智能设备的接入、云端服务的接入等。依托强大的底层技术、智能的算法引擎、完善的云端服务和成熟的软硬件标准系统,AliGenie会持续不断的将全面、易用的核心技术能力进行输出,为开发者带去更多可能。
首页:天猫精灵开放平台|AliGenie
1.png
二、开发步骤
不论是研发大佬还是小白,以下步骤都是很简单的操作。主要是个人私用,或基于小范围使用。
2.1 控制台
在技能平台完成登陆和认证,即可进入首页进行后续操作。首页会有操作台按钮,点击即可进入,并展示历史创建的部署。
微信截图_20220408171250.png
控制台所展示的应用类型有四种:

  • 语音技能
  • 小程序
  • 安卓APP应用
  • H5小游戏
    我们本次的核心是语音技能,也就是进入控制台界面时,所展示的内容。
    2.2 选择模板
    点击创建新技能按钮,进入模板选择界面。按照顺序选择 语音技能->个人技能->祝福模板(或鼓励模板),随后确认创建即可。
    个人技能(私域分享):开发专属的技能在自有音箱上使用,同时也支持分享给亲朋好友,或者公司内指定人员在私域范围内使用。
    祝福模板:播放一段音乐、录音或天猫精灵的合成语音,给家人朋友送上美好的节日祝福。
    3.png
    2.3 祝福模板配置
    本步骤分为三步,对祝福语进行更加细化的配置,从而实现想要的祝福辞。
    第一步:获取祝福
    选择不同的祝福,会有不同的祝福语,视情况选择即可:
    4.png
    第二步:祝福回复
    每次当你通过之前设置的问法来获取祝福时,音箱会从以下设置好的回复列表中随机选择一条进行播报。包括回复语、图片等:
  • 回复内容,可以是文本(语音合成),或者上传音频。语音支持 .mp3 .wav .m4a格式,最大1MB。
  • 除了语音回复之外 ,你还可以通过设置背景图片来提升体验,在带屏设备上可以看到更丰富的图文。
    微信截图_20220408173145.png
    第三步:发布
    本步骤主要是对本次创建应用的属性进行完善,包括命名、描述等,最后点击发布技能即可。
    78.png
    2.4 等待审核发布
    到了此步骤就已经大功告成,等待审核即可。此时可以查看创建的应用详情:
    image.png

微信截图_20220408173849.png

三、总结
这只是一次简单的创建应用,可以满足自娱自乐,同时适合小白学习时的初次体验。平台提供了简单的几个模板,方便开发者操作,当然也是还有很多更为复杂的创建流程,想着实现一个家庭范围内的音乐共享功能,实现上需要一定研发基础,一直不能全部展示,就不在这里一点点展示了。
特点:

  • 平台指引完善
  • 交互体验流畅
  • 逻辑性强,适应各种水平的开发人员
  • 方言识别个性化
    四、建议
  1. 对于全家桶式串联的开发,还需要更为清晰的指引
  2. 平台的模板需要更加丰富,这样更有利于体验
  3. 最好拥有针对不同年龄段的不同处理,这样更适合整个家庭内部的交互

看完就去点个赞吧,每人可以投三票呀!可以都点给一个人,跟兴趣的话,就帮忙点点吧
微信截图_20220414093845.png

相关文章
|
数据可视化 JavaScript 开发工具
天猫精灵之天气查询开发
天猫精灵之天气查询
|
机器学习/深度学习 人工智能 自然语言处理
【AI系统】知识蒸馏原理
本文深入解析知识蒸馏(Knowledge Distillation, KD),一种将大型教师模型的知识高效转移至小型学生模型的技术,旨在减少模型复杂度和计算开销,同时保持高性能。文章涵盖知识蒸馏的基本原理、不同类型的知识(如响应、特征、关系知识)、蒸馏方式(离线、在线、自蒸馏)及Hinton的经典算法,为读者提供全面的理解。
1386 2
【AI系统】知识蒸馏原理
|
Web App开发 JavaScript 前端开发
WebRTC 和 RTC 有什么区别?
【10月更文挑战第25天】WebRTC是RTC的一种具体实现方式,侧重于网页端的实时通信,具有便捷性和跨平台性等特点;而RTC则是一个更广泛的概念,包括了各种不同平台和技术实现的实时通信方式,应用场景更加丰富多样。在实际应用中,需要根据具体的需求和场景选择合适的实时通信技术。
|
机器学习/深度学习 人工智能 自然语言处理
揭秘深度学习中的自注意力机制及其在现代AI应用中的革新
揭秘深度学习中的自注意力机制及其在现代AI应用中的革新
|
人工智能 自然语言处理 Swift
探索面向开放型问题的推理模型Marco-o1,阿里国际AI团队最新开源!
阿里国际AI团队发布的新模型Marco-o1,不仅擅长解决具有标准答案的学科问题(如代码、数学等),更强调开放式问题的解决方案。该模型采用超长CoT数据微调、MCTS扩展解空间等技术,提升了模型在翻译任务及复杂问题解决上的表现。研究团队还开源了部分数据和模型,供社区使用和进一步研究。
1008 1
探索面向开放型问题的推理模型Marco-o1,阿里国际AI团队最新开源!
|
存储 JavaScript 前端开发
一篇文章带你学完JavaScript基础知识,超全的JavaScript知识点总结
一篇文章带你学完JavaScript基础知识,超全的JavaScript知识点总结
445 3
一篇文章带你学完JavaScript基础知识,超全的JavaScript知识点总结
|
存储 Ubuntu Linux
揭开自制NAS的神秘面纱:一步步教你如何用Linux打造专属网络存储王国!
【8月更文挑战第22天】构建Linux NAS系统是技术爱好者的热门项目。通过选择合适的发行版如Alpine Linux或Ubuntu Server,并利用现有硬件,你可以创建一个高效、可定制的存储解决方案。安装Linux后,配置网络设置确保可达性,接着安装Samba或NFS实现文件共享。设置SSH服务方便远程管理,利用`rsync`与`cron`进行定期备份。还可添加Web界面如Nextcloud提升用户体验。这一过程不仅节约成本,还赋予用户高度的灵活性和控制权。随着技术发展,Linux NAS方案持续进化,为用户带来更丰富的功能和可能性。
1370 1
|
人工智能 自然语言处理 语音技术
《ModelScope:模型即服务的创新与未来》
【10月更文挑战第2天】** 本文深入探讨了 ModelScope 所代表的模型即服务(MaaS)模式的发展背景、核心特点、技术优势、应用场景以及对各个领域带来的深远影响。通过对其架构、功能和实际案例的分析,展现了 ModelScope 在推动人工智能发展、促进产业升级和创新方面的巨大潜力,同时也对其未来发展趋势进行了展望。
1098 1
|
机器学习/深度学习 人工智能 算法
将 Visual Basic 与人工智能结合:机器学习的初步探索
【4月更文挑战第27天】本文探讨了Visual Basic(VB)在人工智能,尤其是机器学习领域的应用。VB作为易学易用的编程语言,结合机器学习可为开发者提供简单的人工智能实现途径。通过第三方库、调用外部程序或自行开发算法,VB能实现图像识别、文本分类和预测分析等功能。尽管面临性能、人才短缺和技术更新的挑战,但随着技术发展,VB在人工智能领域的潜力不容忽视,有望创造更多创新应用。
521 0
|
自然语言处理 JavaScript Java
天猫精灵开放平台体验创建语音技能
天猫测评活动——创建一个语音技能的真实操作流程记录
天猫精灵开放平台体验创建语音技能