Android App开发语音处理之系统自带的语音引擎、文字转语音、语音识别的讲解及实战(超详细 附源码)

简介: Android App开发语音处理之系统自带的语音引擎、文字转语音、语音识别的讲解及实战(超详细 附源码)

需要源码请点赞关注收藏后评论区留下QQ~~~

一、系统自带的语音引擎

语音播报的本质是将书面文字转换成自然语言的音频流,这个转换操作被称作语音合成,又称TTS(从文本到语音)在转换过程中,为了避免机械合成的呆板和停顿感,语音合成技术还得对语音流进行平滑处理,以确保输出得语音音律流畅自然。

不管是Android原生的西文引擎还是手机厂商集成的中文引擎,都支持通过系统提供的API处理语音,其中的语音合成工具是TextToSpeech 常用方法如下

构造方法:第二个输入参数为语音监听器

setLanguage:设置引擎语言

setSpeechRate 设置语速

setPitch 设置音调

synthesizeToFile 把指定文本的朗读语言输出到文件

实战效果如下

代码如下

Java类

package com.example.voice;
import android.content.Intent;
import android.os.Bundle;
import android.speech.tts.TextToSpeech;
import android.view.View;
import android.widget.AdapterView;
import android.widget.ArrayAdapter;
import android.widget.ListView;
import android.widget.Spinner;
import androidx.appcompat.app.AppCompatActivity;
import com.example.voice.adapter.LanguageListAdapter;
import com.example.voice.bean.Language;
import java.util.ArrayList;
import java.util.List;
import java.util.Locale;
public class SpeechEngineActivity extends AppCompatActivity {
    private final static String TAG = "SpeechEngineActivity";
    private TextToSpeech mSpeech; // 声明一个文字转语音对象
    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_speech_engine);
        findViewById(R.id.btn_jump_setting).setOnClickListener(v -> {
            Intent intent = new Intent();
            intent.setAction("com.android.settings.TTS_SETTINGS");
            startActivity(intent);
        });
        // 创建一个文字转语音对象,初始化结果在监听器TTSListener中返回
        mSpeech = new TextToSpeech(this, new TTSListener());
    }
    private List<TextToSpeech.EngineInfo> mEngineList; // 语音引擎列表
    // 定义一个文字转语音的初始化监听器
    private class TTSListener implements TextToSpeech.OnInitListener {
        // 在初始化完成时触发
        @Override
        public void onInit(int status) {
            if (status == TextToSpeech.SUCCESS) { // 初始化成功
                if (mEngineList == null) { // 首次初始化
                    // 获取系统支持的所有语音引擎
                    mEngineList = mSpeech.getEngines();
                    initEngineSpinner(); // 初始化语音引擎下拉框
                }
                initLanguageList(); // 初始化语言列表
            }
        }
    }
    // 初始化语音引擎下拉框
    private void initEngineSpinner() {
        String[] engineArray = new String[mEngineList.size()];
        for(int i=0; i<mEngineList.size(); i++) {
            engineArray[i] = mEngineList.get(i).label;
        }
        ArrayAdapter<String> engineAdapter = new ArrayAdapter<>(this,
                R.layout.item_select, engineArray);
        Spinner sp_engine = findViewById(R.id.sp_engine);
        sp_engine.setPrompt("请选择语音引擎");
        sp_engine.setAdapter(engineAdapter);
        sp_engine.setOnItemSelectedListener(new EngineSelectedListener());
        sp_engine.setSelection(0);
    }
    private class EngineSelectedListener implements AdapterView.OnItemSelectedListener {
        public void onItemSelected(AdapterView<?> arg0, View arg1, int arg2, long arg3) {
            //recycleSpeech(); // 回收文字转语音对象
            // 创建指定语音引擎的文字转语音对象
            mSpeech = new TextToSpeech(SpeechEngineActivity.this, new TTSListener(),
                    mEngineList.get(arg2).name);
        }
        public void onNothingSelected(AdapterView<?> arg0) {}
    }
    private String[] mLanguageArray = {"中文普通话", "英语", "法语", "德语", "意大利语",  };
    private Locale[] mLocaleArray = { Locale.CHINA, Locale.ENGLISH, Locale.FRENCH, Locale.GERMAN, Locale.ITALIAN };
    // 初始化语言列表
    private void initLanguageList() {
        List<Language> languageList = new ArrayList<>();
        // 下面遍历语言数组,从中挑选出当前引擎所支持的语言列表
        for (int i=0; i<mLanguageArray.length; i++) {
            String desc = "正常使用";
            // 设置朗读语言
            int result = mSpeech.setLanguage(mLocaleArray[i]);
            if (result == TextToSpeech.LANG_MISSING_DATA) {
                desc = "缺少数据";
            } else if (result == TextToSpeech.LANG_NOT_SUPPORTED) {
                desc = "暂不支持";
            }
            languageList.add(new Language(mLanguageArray[i], desc));
        }
        // 下面把该引擎对各语言的支持情况展示到列表视图上
        ListView lv_language = findViewById(R.id.lv_language);
        LanguageListAdapter adapter = new LanguageListAdapter(this, languageList);
        lv_language.setAdapter(adapter);
    }
}

二、文字转语音

既然明确了一个引擎能够支持哪些语言,接下来就可以大胆设置朗读的语言了,并且设置好语言后,还得提供对应的文字才可以,下面是一个语音播报页面的实例

中文普通话播报

英文版播报

可以在下拉框中选择自己想要朗读的语言

代码如下

Java类

package com.example.voice;
import android.os.Bundle;
import android.speech.tts.TextToSpeech;
import android.util.Log;
import android.view.View;
import android.widget.AdapterView;
import android.widget.ArrayAdapter;
import android.widget.EditText;
import android.widget.Spinner;
import android.widget.Toast;
import androidx.appcompat.app.AppCompatActivity;
import com.example.voice.bean.Language;
import java.util.ArrayList;
import java.util.List;
import java.util.Locale;
public class SpeechComposeActivity extends AppCompatActivity {
    private final static String TAG = "SpeechComposeActivity";
    private TextToSpeech mSpeech; // 声明一个文字转语音对象
    private EditText et_tts; // 声明一个编辑框对象
    private List<TextToSpeech.EngineInfo> mEngineList; // 语音引擎列表
    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_speech_compose);
        et_tts = findViewById(R.id.et_tts);
        findViewById(R.id.btn_read).setOnClickListener(v -> {
            String content = et_tts.getText().toString();
            // 开始朗读指定文本
            int result = mSpeech.speak(content, TextToSpeech.QUEUE_FLUSH, null, null);
            String desc = String.format("朗读%s", result==TextToSpeech.SUCCESS?"成功":"失败");
            Toast.makeText(this, desc, Toast.LENGTH_SHORT).show();
        });
        // 创建一个文字转语音对象,初始化结果在监听器的onInit方法中返回
        mSpeech = new TextToSpeech(this, mListener);
    }
    // 创建一个文字转语音的初始化监听器实例
    private TextToSpeech.OnInitListener mListener = status -> {
        if (status == TextToSpeech.SUCCESS) { // 初始化成功
            if (mEngineList == null) { // 首次初始化
                mEngineList = mSpeech.getEngines(); // 获取系统支持的所有语音引擎
                initEngineSpinner(); // 初始化语音引擎下拉框
            }
            initLanguageSpinner(); // 初始化语言下拉框
        }
    };
    // 初始化语音引擎下拉框
    private void initEngineSpinner() {
        String[] engineArray = new String[mEngineList.size()];
        for(int i=0; i<mEngineList.size(); i++) {
            engineArray[i] = mEngineList.get(i).label;
        }
        ArrayAdapter<String> engineAdapter = new ArrayAdapter<>(this,
                R.layout.item_select, engineArray);
        Spinner sp_engine = findViewById(R.id.sp_engine);
        sp_engine.setPrompt("请选择语音引擎");
        sp_engine.setAdapter(engineAdapter);
        sp_engine.setOnItemSelectedListener(new EngineSelectedListener());
        sp_engine.setSelection(0);
    }
    private class EngineSelectedListener implements AdapterView.OnItemSelectedListener {
        public void onItemSelected(AdapterView<?> arg0, View arg1, int arg2, long arg3) {
            recycleSpeech(); // 回收文字转语音对象
            // 创建指定语音引擎的文字转语音对象
            mSpeech = new TextToSpeech(SpeechComposeActivity.this, mListener,
                    mEngineList.get(arg2).name);
        }
        public void onNothingSelected(AdapterView<?> arg0) {}
    }
    // 回收文字转语音对象
    private void recycleSpeech() {
        if (mSpeech != null) {
            mSpeech.stop(); // 停止文字转语音
            mSpeech.shutdown(); // 关闭文字转语音
            mSpeech = null;
        }
    }
    @Override
    protected void onDestroy() {
        super.onDestroy();
        recycleSpeech(); // 回收文字转语音对象
    }
    private String[] mLanguageArray = {"中文普通话", "英语", "法语", "德语", "意大利语"};
    private Locale[] mLocaleArray = { Locale.CHINA, Locale.ENGLISH, Locale.FRENCH, Locale.GERMAN, Locale.ITALIAN };
    private String[] mValidLanguageArray; // 当前引擎支持的语言名称数组
    private Locale[] mValidLocaleArray; // 当前引擎支持的语言类型数组
    private String mTextCN = "离离原上草,一岁一枯荣。野火烧不尽,春风吹又生。";
    private String mTextEN = "Hello World. Nice to meet you. This is a TTS demo.";
    // 初始化语言下拉框
    private void initLanguageSpinner() {
        List<Language> languageList = new ArrayList<>();
        // 下面遍历语言数组,从中挑选出当前引擎所支持的语言列表
        for (int i=0; i<mLanguageArray.length; i++) {
            // 设置朗读语言。通过检查方法的返回值,判断引擎是否支持该语言
            int result = mSpeech.setLanguage(mLocaleArray[i]);
            Log.d(TAG, "language="+mLanguageArray[i]+",result="+result);
            if (result != TextToSpeech.LANG_MISSING_DATA
                    && result != TextToSpeech.LANG_NOT_SUPPORTED) { // 语言可用
                languageList.add(new Language(mLanguageArray[i], mLocaleArray[i]));
            }
        }
        mValidLanguageArray = new String[languageList.size()];
        mValidLocaleArray = new Locale[languageList.size()];
        for(int i=0; i<languageList.size(); i++) {
            mValidLanguageArray[i] = languageList.get(i).name;
            mValidLocaleArray[i] = languageList.get(i).locale;
        }
        // 下面初始化语言下拉框
        ArrayAdapter<String> languageAdapter = new ArrayAdapter<>(this,
                R.layout.item_select, mValidLanguageArray);
        Spinner sp_language = findViewById(R.id.sp_language);
        sp_language.setPrompt("请选择朗读语言");
        sp_language.setAdapter(languageAdapter);
        sp_language.setOnItemSelectedListener(new LanguageSelectedListener());
        sp_language.setSelection(0);
    }
    private class LanguageSelectedListener implements AdapterView.OnItemSelectedListener {
        public void onItemSelected(AdapterView<?> arg0, View arg1, int arg2, long arg3) {
            if (mValidLocaleArray[arg2]==Locale.CHINA) { // 汉语
                et_tts.setText(mTextCN);
            } else { // 其他语言
                et_tts.setText(mTextEN);
            }
            mSpeech.setLanguage(mValidLocaleArray[arg2]); // 设置选中的朗读语言
        }
        public void onNothingSelected(AdapterView<?> arg0) {}
    }
}

三、原生的语音识别

Android提供了语音识别器SpeechRecognizer 该工具常用方法如下

isRecognitionAvailable  检查系统是否支持原生的语音识别

createSpeechRecognizer 创建原生的语音识别器对象

setRecognitionListener 设置语音识别监听器

startListening 开始语音识别

stopListening 停止语音识别

cancel 取消语音识别

destroy 销毁语音识别器

识别结果监听器提供了许多回调方法,其中onResults方法可获得识别后的文本信息,然而每个引擎对文本结果的包装结构不尽相同,比如百度语音返回JSON格式的字符串,而讯飞语音返回字符串列表,为此要分别尝试几种格式的文本识别  效果如下

结果如下 点击开始识别后对着麦克风说话 停止识别后则会自动输出识别内容

此处连接真机测试更佳 模拟机可能没有麦克风~~~

代码如下

java类

package com.example.voice;
import androidx.appcompat.app.AppCompatActivity;
import android.annotation.SuppressLint;
import android.content.ComponentName;
import android.content.Intent;
import android.graphics.Color;
import android.os.Bundle;
import android.provider.Settings;
import android.speech.RecognitionListener;
import android.speech.RecognizerIntent;
import android.speech.SpeechRecognizer;
import android.util.Log;
import android.widget.Button;
import android.widget.TextView;
import org.json.JSONArray;
import org.json.JSONObject;
import java.util.List;
import java.util.Locale;
@SuppressLint("SetTextI18n")
public class SpeechRecognizeActivity extends AppCompatActivity implements RecognitionListener {
    private final static String TAG = "SpeechRecognizeActivity";
    private TextView tv_result; // 声明一个文本视图对象
    private Button btn_recognize; // 声明一个按钮对象
    private SpeechRecognizer mRecognizer; // 声明一个语音识别对象
    private boolean isRecognizing = false; // 是否正在识别
    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_speech_recognize);
        tv_result = findViewById(R.id.tv_result);
        btn_recognize = findViewById(R.id.btn_recognize);
        // 检查系统是否支持原生的语音识别
        boolean enable = SpeechRecognizer.isRecognitionAvailable(this);
        if (enable) {
            initRecognize(); // 初始化语音识别
        } else {
            tv_result.setText("原生的语音识别服务不可用");
            btn_recognize.setEnabled(false);
            btn_recognize.setTextColor(Color.GRAY);
        }
    }
    // 初始化语音识别
    private void initRecognize() {
        String serviceComponent = Settings.Secure.getString(
                getContentResolver(), "voice_recognition_service");
        // 获得系统内置的语音识别服务
        ComponentName component = ComponentName.unflattenFromString(serviceComponent);
        Log.d(TAG, "getPackageName="+component.getPackageName()+",getClassName="+component.getClassName());
        tv_result.setText("原生的语音识别服务采用"+component.getPackageName()
                +"里的服务"+component.getClassName());
        // 创建原生的语音识别器对象
        mRecognizer = SpeechRecognizer.createSpeechRecognizer(this);
        mRecognizer.setRecognitionListener(this); // 设置语音识别监听器
        btn_recognize.setOnClickListener(v -> {
            if (!isRecognizing) { // 未在识别
                Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH);
                intent.putExtra(RecognizerIntent.EXTRA_PARTIAL_RESULTS, true);
                intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE, Locale.CHINA);
                intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,
                        RecognizerIntent.LANGUAGE_MODEL_FREE_FORM);
                intent.putExtra(RecognizerIntent.EXTRA_MAX_RESULTS, 5);
                mRecognizer.startListening(intent); // 开始语音识别
            } else { // 正在识别
                mRecognizer.stopListening(); // 停止语音识别
                //mRecognizer.cancel(); // 取消语音识别
            }
            isRecognizing = !isRecognizing;
            btn_recognize.setText(isRecognizing?"停止识别":"开始识别");
        });
    }
    @Override
    public void onReadyForSpeech(Bundle params) {}
    @Override
    public void onBeginningOfSpeech() {}
    @Override
    public void onRmsChanged(float rmsdB) {}
    @Override
    public void onBufferReceived(byte[] buffer) {}
    @Override
    public void onEndOfSpeech() {}
    @Override
    public void onError(int error) {
        Log.d(TAG, "Recognize error:"+error);
    }
    @Override
    public void onResults(Bundle results) {
        Log.d(TAG, "onResults Start");
        String desc = "";
        String key = SpeechRecognizer.RESULTS_RECOGNITION;
        try { // 百度语音分支
            String result = results.getString(key);
            Log.d(TAG, "result="+result);
            JSONObject object = new JSONObject(result);
            String recognizeResult = object.getString("recognizeResult");
            JSONArray recognizeArray = new JSONArray(recognizeResult);
            for (int i=0; i<recognizeArray.length(); i++) {
                JSONObject item = (JSONObject) recognizeArray.get(i);
                String se_query = item.getString("se_query");
                desc = desc + "\n" + se_query;
                Log.d(TAG, "desc="+desc);
            }
        } catch (Exception e) { // 讯飞语音分支
            e.printStackTrace();
            List<String> resultList = results.getStringArrayList(key);
            for (String str : resultList) {
                desc = desc + "\n" + str;
                Log.d(TAG, "desc="+desc);
            }
        }
        tv_result.setText("识别到的文字为:"+desc);
        Log.d(TAG, "onResults End");
    }
    @Override
    public void onPartialResults(Bundle partialResults) {
        Log.d(TAG, "onPartialResults");
    }
    @Override
    public void onEvent(int eventType, Bundle params) {}
    @Override
    protected void onDestroy() {
        super.onDestroy();
        if (mRecognizer != null) {
            mRecognizer.destroy(); // 销毁语音识别器
        }
    }
}

创作不易 觉得有帮助请点赞关注收藏~~~

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
5天前
|
测试技术 Android开发
Android App获取不到pkgInfo信息问题原因
Android App获取不到pkgInfo信息问题原因
14 0
|
17天前
|
监控 数据可视化 安全
智慧工地SaaS可视化平台源码,PC端+APP端,支持二开,项目使用,微服务+Java++vue+mysql
环境实时数据、动态监测报警,实时监控施工环境状态,有针对性地预防施工过程中的环境污染问题,打造文明生态施工,创造绿色的生态环境。
14 0
智慧工地SaaS可视化平台源码,PC端+APP端,支持二开,项目使用,微服务+Java++vue+mysql
|
1月前
|
缓存 移动开发 Java
构建高效Android应用:内存优化实战指南
在移动开发领域,性能优化是提升用户体验的关键因素之一。特别是对于Android应用而言,由于设备和版本的多样性,内存管理成为开发者面临的一大挑战。本文将深入探讨Android内存优化的策略和技术,包括内存泄漏的诊断与解决、合理的数据结构选择、以及有效的资源释放机制。通过实际案例分析,我们旨在为开发者提供一套实用的内存优化工具和方法,以构建更加流畅和高效的Android应用。
游戏直播APP平台开发多少钱成本:定制与成品源码差距这么大
开发一款游戏直播APP平台所需的费用是多少?对于计划投身这一领域的投资者来说,首要关心的问题之一就是。本文将探讨两种主要的开发模式——定制开发与成品源码二次开发的成本差异及其优劣势。
|
1月前
|
传感器 人工智能 数据可视化
Java智慧工地监管一体化云平台APP源码 SaaS模式
高支模监测:高支模立杆及倾斜角度,高支模立杆的荷载,架体的水平位移以及模板沉降情况,当检测数据超过预警值时,实时报警。
32 2
|
1月前
|
人工智能 监控 前端开发
Java智慧城管系统源码 数字城管APP系统源码 城市管理综合执法监督系统源码
Java编写的智慧城管系统源码,包含数字城管APP和综合执法监督系统,运用物联网、云计算等技术实现城市全面智慧管理。系统采用微服务架构,Java开发,结合vue前端框架和SpringBoot后端框架,支持MySQL数据库和uniapp移动端。功能模块包括执法办案、视频分析、统计分析等,提升案件办理和监管效能,促进行政执法创新,实现电子送达和非接触执法。
19 1
|
1月前
|
编解码 小程序 算法
短剧系统开发(网页版/APP/小程序)丨短剧系统开发运营版及源码出售
短剧系统开发功能旨在为用户提供观看、分享和交流短剧作品的平台,涉及多种功能和特性,
|
1月前
|
移动开发 负载均衡 小程序
代驾app开发丨代驾系统开发玩法详情丨代驾系统开发网页版/H5/小程序及源码部署
**司机/代驾员端**:司机可以通过APP接收订单,查看订单详情、路线和导航,提供现场服务并进行确认。
|
1月前
|
设计模式 测试技术 数据库
基于Android的食堂点餐APP的设计与实现(论文+源码)_kaic
基于Android的食堂点餐APP的设计与实现(论文+源码)_kaic
|
1月前
|
Java 关系型数据库 MySQL
社区便利店销售微信APP的设计与实现(源码+论文)_kaic
社区便利店销售微信APP的设计与实现(源码+论文)_kaic