AI语音技能云开发-创建一个语音技能

简介: 创建一个语音技能

涉及到的平台


创建第一个[Hello World]技能

一、天猫精灵开放平台登录

1.1 登录之后,在右上角的控制台中选择技能应用平台
image.png1.2 首次登录时,您需要签署平台合作协议

该认证的认证,该确定的确定,都是这么过来的~~~

二、创建一个“语音技能”

2.1 在“我的技能应用”Tab中,选择“语音技能”->“创建新技能”

image.png

2.2 填写节能基本信息

选中 语音技能 中的 自定义技能 填写技能创建信息:技能名称 调用词


  • 技能名称:展示在技能市场的技能名称,在发布时将进行唯一性检测。
  • 技能属性:这里选择公有技能。私有技能是针对的是定制机生态设备
  • 技能调用词:也称为 唤醒词,是用户使用这个技能所需要说的关键字。如:在调试阶段输入“欢迎”,回复“Hello World”
  • 后端资源的部署方式:选择阿里云云开发(FAAS)


点击确认创建

image.png

2.3 技能创建成功

image.png

三、配置语音交互模型

3.1 点击创建意图

image.png

3.2 设置意图名称、意图标识,并将这条意图设置为默认意图,设置好点击提交

image.png

四、后端服务

4.1 顶部导航栏中选择后端服务,并在左侧导航栏中选择服务部署

image.png

4.2 点击继续部署,选择阿里云云原生(FAAS)

image.png

4.3 关联阿里云账号

image.png

4.4 选择阿里云账号的登录方式

image.png

4.5 登录阿里云账号(如果没有阿里云账号就注册一个)
4.6 登录成功后需要签署《云开发平台服务协议》,签署之后就可以免费使用云开发平台进行服务开发了

image.png

4.7 签署协议后,在团队注册页翻到页面底部,点击“统一授权”,授权后点击“下一步”

image.png

4.8 完成并返回 技能开发平台

image.png

4.9 开通开运资源

image.png

4.10 创建技能应用,点击保存

image.png

image.png

4.11 点击“前往开发”,跳转到“阿里云开发平台CloudIDE”

image.png

4.12 发布“预发环境”,去技能平台进行在线测试

image.png

五、在线测试

image.png

在输入唤醒词中,输入“欢迎”,返回“Hello World”

image.png

六、真机测试

如有“真机”,也可以“真机测试”。

七、应用下线

在测试完成后,要在云开发平台中“我的应用及时将部署的应用下线,因为免费额度有限,不及时下线将会产生不必要的费用

一定要注意!!!

image.png


写在最后:开发文档详见https://aligenie.com/doc/20255408/yk3i51


下一篇,我们将实现与“语音技能”的简单对话


文章搬自:https://blog.csdn.net/miao_x_m/article/details/121105307

目录
相关文章
|
17天前
|
弹性计算 人工智能 Kubernetes
基于云效 AppStack,5 分钟搞定一个 AI 应用的开发和部署
区别于传统的流水线工具,本实验将带你体验云效应用交付平台 AppStack,从应用视角,完成一个 AI 聊天应用的高效交付。
55404 25
|
5天前
|
人工智能 API 数据安全/隐私保护
云效+SAE,5分钟搞定一个AI 应用的开发和部署
本实验将带你体验云效应用交付平台AppStack+Serverless 应用交付引擎 SAE,从应用视角,完成一个AI聊天助手的高效交付。
124 0
|
13天前
|
机器学习/深度学习 人工智能 数据处理
AI技术来支持开发过程中的自动化和智能化
AI技术来支持开发过程中的自动化和智能化
156 2
|
2月前
|
人工智能 自然语言处理 算法
GPT-4o:重塑AI语音对话的边界与机遇
最近技术圈又出了新的“爆炸”新闻,因为OpenAI再次掀起技术浪潮,发布了最新旗舰模型GPT-4o,通过官方的消息显示这款全新的模型凭借超高速的语音响应能力和多模态交互革新,不仅让AI语音对话的交互体验更加流畅自然,还以免费使用的形式,给用户和行业带来了前所未有的震撼。那么GPT-4o相比前代有哪些显著的技术提升?它的发布又为国内大模型行业带来了哪些机会呢?本文就来简单聊一聊,欢迎大家在评论区留言交流。
46 2
GPT-4o:重塑AI语音对话的边界与机遇
|
16天前
|
人工智能 搜索推荐 测试技术
《AIGC+软件开发新范式》--05.阿里云首个 AI 员工入职,围观开发工程师使用反馈
在AI 热度持续上升的当下,阿里云推出AI智能编码助手—通义灵码。通义灵码是一款基于阿里云通义代码大模型打造的智能编码助手,基于海量优秀开源代数据集和编程教科书训练,为开发者带来高效、流畅的编码体验。
246 1
|
27天前
|
弹性计算 人工智能 Kubernetes
基于云效 AppStack,5分钟搞定一个 AI 应用的开发和部署
实验介绍了如何使用云效应用交付平台AppStack快速初始化和部署AI聊天应用.
950 3
|
12天前
|
人工智能 API 语音技术
使用 Gemini Pro AI 开发 Android 应用程序
使用 Gemini Pro AI 开发 Android 应用程序
18 0
|
2月前
|
机器学习/深度学习 人工智能 语音技术
AI让失语者重新说话!纽约大学发布全新神经-语音解码器
【5月更文挑战第19天】纽约大学研发的神经-语音解码器,结合深度学习与语音合成,为失语者带来新希望。此脑机接口技术能将大脑神经信号转化为语音参数,再通过合成器转为可听语音。使用癫痫患者的数据进行训练,解码器已成功重现语音,尽管质量有待提升。该技术有望革新沟通方式,但也面临数据复杂性、隐私保护及社会接受度等挑战。[论文链接](https://www.nature.com/articles/s42256-024-00824-8)
49 5
|
16天前
|
机器学习/深度学习 人工智能 搜索推荐
推荐3个文本转语音AI工具
三款文本转语音工具各具特色,适用于不同的场景和需求。ELEVENLABS语音合成凭借其高质量的语音输出和先进的技术支持,适合对音质有较高要求的用户;TTSMAKER语音合成简单易用,功能丰富,适合普通用户日常使用;SPEECHIFY文本转语音则注重实用性和便捷性,特别适用于长时间阅读或学习场景。无论你是职场人士、学生还是语言学习者,都能在这些工具中找到适合自己的选择。【6月更文挑战第4天】
34 0
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
2024通义语音AI技术图景,大模型引领AI再进化
2024通义语音AI技术图景,大模型引领AI再进化