讯飞AIUI智能机器人3---来和机器互动吧(语音技术综合应用)

简介: 讯飞AIUI智能机器人3---来和机器互动吧(语音技术综合应用)

简介

通过 AIUI 的配置及调用,开发一个关于语音合成的智能应用, 让学生了解语音合成技术如何在机器人上使用,同时对语音合成技术的使用途 径和步骤进行详细讲解。最后完成语音的合成。

🍓🍓1、了解 AIUI 开放平台账号申请、应用创建及配置;

🍓🍓2、掌握使用开发套件完成机器人智能应用的开发与调试;

🍓🍓3、掌握语音合成能力接口的调用开发。

内容

🍓🍓1、语音合成技术,将文本内容合成为自然语音,并通过设备发声;

🍓🍓2、语音识别技术,将自然语音通过转写引擎识别为文本内容;

🍓🍓3、语义理解技术,对自然语言文本的理解,识别其具体表达的意思。

步骤

步骤 1:AIUI 开放平台应用添加及设置image.pngimage.png

步骤 2:项目工程搭建及能力包导入image.png

步骤 3:项目 AIUI 能力导入及配置

在完成了工程项目的搭建后,我们需要在项目工程中集成 AIUI 能力,具体 步骤如下:

💥💥1、 首先,导入配置文件,将 aiui.cfg 文件导入到应用工程目录:src/main/assets/cfg/ (该文件示例工程同目录中可获取)。

💥💥2、修改 aiui.cfg 文件中的配置信息,具体如下image.png修改代码中*标识的位置,主要包括 appid,appkey,scene(场景),将 AIUI 平台创建的应用相关信息填入。 同时需要在 AndroidManifest.xml 中完成权限申请image.png

步骤 4:功能代码开发

💥💥1、当应用接收到语音“你是谁”时,通过语音合成文本“我是小途,很高兴 为您服务。”进行回答;

💥💥2、 当应用接收到语音“你会干什么”时,通过语音合成文本“我可以陪你聊 天,为你解答问题,还可以给你唱歌哦。”进行回答。

💥💥3、首先,在的应用工程 MainActivity.java 文件的 onCreate 方法中进行 AIUI 的 能力初始化,并在文件中添加 AIUI 的回调方法;修改页面布局文件,添加一个 ID 为 txtArea 的 TextView 文本控件。


部分代码:

基础功能初始化:


private void init() {
    StarLogAbility.getInstance().initAbility(this);
    //基础能力初始化
    StarCommonAbility.getInstance().initAbility(this,
            RobotType.TYPE_TEACHING, new StarCommonAbility.onResultCallback() {
                @Override
                public void onResult(boolean isSuccess, String hardCode) {
                    if (isSuccess) {
                        //硬件和业务状态初始化
                        switch (hardCode) {
                            case PartCode.HARDWARE_PARTCODE.CODE_EMOJI:
                                //设置初始表情
                                EmojiHelper.doEmojiBase();
                                break;
                            case PartCode.HARDWARE_PARTCODE.CODE_GPIO:
                                //默认加载的时候,将拾音方向设置为默认正前方的0度。
                                GPIOHelper.getInstance().setMainMic(0);
                                break;
                            case PartCode.HARDWARE_PARTCODE.CODE_CENTER_LIGHT:
                                //关闭腹部灯带
                                CenterLightHelper.takeCenterLightOff();
                                break;
                            default:
                                break;
                        }
                    }
                }
            });
}

🎂🎂重写回答(待合成)预料库:

@Override
public void onAiuiResponse(String semantic) {
    Log.i("test", "test:" + semantic);
    if (TextUtils.isEmpty(semantic)) {
        return;
    }
    try {
        JSONObject object = new JSONObject(semantic);
        if (null == object) {
            return;
        }
        JSONObject intentObject = object.optJSONObject("intent");
        if (null == intentObject) {
            return;
        }
        final TextView txtArea = (TextView) findViewById(R.id.txtArea);
        if (intentObject.has("text")) {
            String txt = intentObject.getString("text");
            if (TextUtils.equals(txt, "你是谁")) {
                txtArea.setText("我是小途,很高兴为您服务。");
                SpeechHelper.getInstance().speak("我是小途,很高兴为您服务。");
            } else if (TextUtils.equals(txt, "你会干什么")) {
                txtArea.setText("我可以陪你聊天,为你解答问题,还可以给你唱歌哦。陶士雯,CSDN博主");
                SpeechHelper.getInstance().speak("我可以陪你聊天,为你解答问题,还可以给你唱歌哦。", new TTS.OnSpeakCallback() {
                    @Override
                    public void onSpeak(String s) {
                        //需要在主线程中进行界面元素的修改
                        runOnUiThread(new Runnable() {
                            @Override
                            public void run() {
                                txtArea.setText("您好,请问有什么可以帮您?");
                            }
                        });
                    }
                });
            }
        }
    } catch (Exception e) {
        e.printStackTrace();
    }
}

步骤 5:应用权限申请

跟以前在安装 APP 的是就申请了权限不同,Google 在 API 23,也就 Android6.0 之后加入了动态权限。对于一些敏感的权限,决定权交还给了用户, 不再是强制申请了。因为这个原因,如果 APP 需要支持 Android6.0 以上的系 统,就需要进行一下适配,否则 APP 就会崩溃。除了进入设置手动开启权限,还有两种方式让应用获得权限:动态权限申请、 平台签名。本次实验我们采用动态权限申请的方式获得权限。image.png

步骤6:实验结果

首先套件机器接受你输入的语音,然后在事先准备好的问答库中找到问题,找不到问题默认不输出语音。在语音输出的同时界面上也会有相应的文字输出。image.pngimage.png





目录
相关文章
|
21天前
|
数据采集 自动驾驶 机器人
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
74 1
|
5月前
|
弹性计算 自然语言处理 Ubuntu
从0开始在阿里云上搭建基于通义千问的钉钉智能问答机器人
本文描述在阿里云上从0开始构建一个LLM智能问答钉钉机器人。LLM直接调用了阿里云百炼平台提供的调用服务。
从0开始在阿里云上搭建基于通义千问的钉钉智能问答机器人
|
4月前
|
机器人
陌陌自动回复消息脚本,陌陌自动打招呼回复机器人插件,自动聊天智能版
这是一款为陌陌用户设计的自动回复软件,旨在解决用户无法及时回复消息的问题,提高成交率和有效粉丝数。软件通过自动化操作实现消息检测与回复功能
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
TsingtaoAI具身智能机器人开发套件及实训方案
该产品套件创新性地融合了先进大模型技术、深度相机与多轴协作机械臂技术,构建了一个功能强大、灵活易用的人机协作解决方案。其核心在于将智能决策、精准感知与高效执行完美结合,为高校实训领域的发展注入新动力。
420 10
|
4月前
|
人工智能 边缘计算 自然语言处理
大模型应用实践:2025年智能语音机器人厂商推荐和方案详解
随着数字化转型加速,AI客服机器人市场规模预计2025年突破500亿美元,年复合增长率超25%。其发展由语音交互升级、垂直场景解决方案成熟及多模态融合与边缘计算普及三大趋势驱动。文章分析了智能语音机器人的选型核心维度,包括技术性能、场景适配、数据治理与成本效益,并对比了国内外代表厂商如合力亿捷、Zendesk等的方案特点,为企业提供选型策略与落地建议,助力实现服务模式的根本性变革。
421 0
|
6月前
|
人工智能 自然语言处理 安全
Deepseek 的 “灵魂”,宇树的 “躯体”,智能机器人还缺一个 “万万不能”
法思诺创新探讨智能机器人产业的发展,指出Deepseek的AI“灵魂”与宇树的机器人“躯体”虽技术先进,但缺乏关键的商业模式。文章分析了两者在硬件和软件领域的困境,并提出通过软硬一体化结合及明确商业模式,才能实现真正实用的智能机器人。未来,需聚焦高频刚需场景、优化付费体验、推动技术创新,让智能机器人走进千家万户。法思诺提供相关课程与咨询服务,助力行业突破。
143 0
|
7月前
|
人工智能 自然语言处理 机器人
9.9K star!大模型原生即时通信机器人平台,这个开源项目让AI对话更智能!
"😎高稳定、🧩支持插件、🦄多模态 - 大模型原生即时通信机器人平台"
206 0
|
9月前
|
人工智能 机器人 API
AppFlow:无代码部署Dify作为钉钉智能机器人
本文介绍如何通过计算巢AppFlow完成Dify的无代码部署,并将其配置到钉钉中作为智能机器人使用。首先,在钉钉开放平台创建应用,获取Client ID和Client Secret。接着,创建消息卡片模板并授予应用发送权限。然后,使用AppFlow模板创建连接流,配置Dify鉴权凭证及钉钉连接凭证,完成连接流的发布。最后,在钉钉应用中配置机器人,发布应用版本,实现与Dify应用的对话功能。
1826 7
AppFlow:无代码部署Dify作为钉钉智能机器人
|
6月前
|
传感器 机器学习/深度学习 人工智能
自己都站不稳,怎么护理人?智能机器人的自主平衡问题,用TRIZ和DeepSeek有解吗?
法思诺创新探讨机器人自主平衡难题,结合TRIZ创新理论与DeepSeek大模型,为仿人机器人动态平衡提供解决方案。文章分析了机器人平衡差的原因,包括复杂环境、传感器限制、算法难度和机械设计挑战等,并提出通过TRIZ原理(如矛盾识别、理想解)与DeepSeek的AI能力(如数据学习、强化学习)协同优化平衡性能。展望未来,2024-2028年将实现从实验室验证到家用场景落地,推动消费级人形机器人发展。
237 0
|
8月前
|
人工智能 自然语言处理 算法
基于DeepSeek的具身智能高校实训解决方案——从DeepSeek+机器人到通用具身智能
本实训方案围绕「多模态输入 -> 感知与理解 -> 行动执行 -> 反馈学习」的闭环过程展开。通过多模态数据的融合(包括听觉、视觉、触觉等),并结合DeepSeek模型和深度学习算法,方案实现了对自然语言指令的理解、物体识别和抓取、路径规划以及任务执行的完整流程。
1072 12

热门文章

最新文章