autojs之语音转写

简介: 使用情景手机实现语音识别

使用情景


手机实现语音识别


效果展示

微信图片_20220624130601.jpg


原理


使用讯飞webpai调用讯飞的语音转写服务


难点


上传语音文件


你将学到以下知识


  1. 给讯飞发送语音文件
  2. 分片序号的生成
  3. 计算签名
  4. HmacSHA1加密
  5. 10位时间戳, 不要科学记数法
  6. 另类的文件上传方式


代码讲解


  1. 导入java类
importClass(java.io.UnsupportedEncodingException);
importClass(java.security.InvalidKeyException);
importClass(java.security.MessageDigest);
importClass(java.security.NoSuchAlgorithmException);
importClass(java.security.SignatureException);
importClass(javax.crypto.Mac);
importClass(javax.crypto.spec.SecretKeySpec);


  1. 初始化所有的参数, APPIDSECRET_KEY请改为自己的.
const APPID = "XXX";
const SECRET_KEY = "XXX";
let filepath = "/sdcard/1.mp3";
let lfasr_host = "http://raasr.xfyun.cn/api";
// # 请求的接口名
let api_prepare = "/prepare";
let api_upload = "/upload";
let api_merge = "/merge";
let api_get_progress = "/getProgress";
let api_get_result = "/getResult";


  1. 预处理
const taskId = prepare();


  1. 文件分片上传
upload();


  1. 合并文件
merge();


  1. 查询处理进度
for (var i = 0; i < 10; i++) {
  let r = getProgress();
  if (r) {
    break;
  } else {
    log("服务器正常按照排队识别语音, 请稍后");
  }
  sleep(5000);
}


  1. 获取结果
let result = getResult();
log(result);


签名计算过程


function HmacSHA1Encrypt(encryptText, encryptKey) {
  let rawHmac;
  encryptText = java.lang.String(encryptText);
  encryptKey = java.lang.String(encryptKey);
  let data = encryptKey.getBytes("UTF-8");
  let secretKey = new SecretKeySpec(data, "HmacSHA1");
  let mac = Mac.getInstance("HmacSHA1");
  mac.init(secretKey);
  let text = encryptText.getBytes("UTF-8");
  rawHmac = mac.doFinal(text);
  let oauth = android.util.Base64.encodeToString(rawHmac, 2);
  return oauth;
}


名人名言


思路是最重要的, 其他的百度, bing, stackoverflow, github, 安卓文档, autojs文档, 最后才是群里问问
--- 牙叔教程


声明


部分内容来自网络
本教程仅用于学习, 禁止用于其他用途








相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
11月前
|
达摩院 Java 大数据
达摩院FunASR实时语音转写服务软件包发布
达摩院FunASR实时语音转写服务软件包发布
793 0
达摩院FunASR实时语音转写服务软件包发布
|
1月前
|
人工智能 API 语音技术
在MoneyPrinterPlus中使用本地chatTTS语音模型
chatTTS是一个开源的优秀语音合成工具,现在你可以在MoneyPrinterPlus中轻松的使用本地chatTTS模型来为视频生成语音了。
在MoneyPrinterPlus中使用本地chatTTS语音模型
|
13天前
|
搜索推荐 算法 Linux
这款文本转语音(TTS)
【8月更文挑战第6天】Fish Speech是一款先进的开源文本转语音(TTS)工具,它能迅速将文字转换为流畅自然的语音,尤其适合镜头前感到紧张的人制作视频内容。Fish Speech支持中文、英文及日文等多种语言,可通过简单的原始语音样本快速克隆个性化声音。其架构设计高效,仅需4GB显存即可运行,采用Flash-Attn算法实现高性能语音合成。Fish Speech具备易用性,提供Web界面操作,并可在Linux与Windows系统上部署。用户可通过官网([https://fish.audio/zh-CN/](https://fish.audio/zh-CN/))直接体验其强大功能。
30 0
|
3月前
|
人工智能 机器人 Android开发
ChatGPT新增朗读功能,可以语音播报生成结果
【2月更文挑战第15天】ChatGPT新增朗读功能,可以语音播报生成结果
108 1
ChatGPT新增朗读功能,可以语音播报生成结果
|
3月前
|
自然语言处理 监控 语音技术
ModelScope-FunASR支持离线语音转写
【2月更文挑战第19天】ModelScope-FunASR支持离线语音转写
143 1
|
3月前
使用ModelScope FunASR官网的体验链接进行10M录音文件的识别
你在使用ModelScope FunASR官网的体验链接进行10M录音文件的识别时,遇到了无法识别的问题【1月更文挑战第8篇】
75 1
|
语音技术
阿里云语音识别服务提供了三个版本的录音文件识别
阿里云语音识别服务提供了三个版本的录音文件识别
451 1
|
机器学习/深度学习 Linux API
【超简单】之基于PaddleSpeech搭建个人语音听写服务
【超简单】之基于PaddleSpeech搭建个人语音听写服务
876 0
【超简单】之基于PaddleSpeech搭建个人语音听写服务
|
语音技术
TTS语音播报
TTS语音播报
290 0
TTS语音播报
|
XML Java 程序员
Android 讯飞语音合成、语音播报(详细步骤+源码)
Android 讯飞语音合成、语音播报(详细步骤+源码)
412 0
Android 讯飞语音合成、语音播报(详细步骤+源码)