autojs之语音转写-阿里云开发者社区

autojs之语音转写

2022-06-24 488

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 使用情景手机实现语音识别

使用情景

手机实现语音识别

效果展示

微信图片_20220624130601.jpg

原理

使用讯飞webpai调用讯飞的语音转写服务

难点

上传语音文件

你将学到以下知识

给讯飞发送语音文件
分片序号的生成
计算签名
HmacSHA1加密
10位时间戳, 不要科学记数法
另类的文件上传方式

代码讲解

导入java类

importClass(java.io.UnsupportedEncodingException);
importClass(java.security.InvalidKeyException);
importClass(java.security.MessageDigest);
importClass(java.security.NoSuchAlgorithmException);
importClass(java.security.SignatureException);
importClass(javax.crypto.Mac);
importClass(javax.crypto.spec.SecretKeySpec);

初始化所有的参数, APPID和SECRET_KEY请改为自己的.

const APPID = "XXX";
const SECRET_KEY = "XXX";
let filepath = "/sdcard/1.mp3";
let lfasr_host = "http://raasr.xfyun.cn/api";
// # 请求的接口名
let api_prepare = "/prepare";
let api_upload = "/upload";
let api_merge = "/merge";
let api_get_progress = "/getProgress";
let api_get_result = "/getResult";

预处理

const taskId = prepare();

文件分片上传

upload();

合并文件

merge();

查询处理进度

for (var i = 0; i < 10; i++) {
  let r = getProgress();
  if (r) {
    break;
  } else {
    log("服务器正常按照排队识别语音, 请稍后");
  }
  sleep(5000);
}

获取结果

let result = getResult();
log(result);

签名计算过程

function HmacSHA1Encrypt(encryptText, encryptKey) {
  let rawHmac;
  encryptText = java.lang.String(encryptText);
  encryptKey = java.lang.String(encryptKey);
  let data = encryptKey.getBytes("UTF-8");
  let secretKey = new SecretKeySpec(data, "HmacSHA1");
  let mac = Mac.getInstance("HmacSHA1");
  mac.init(secretKey);
  let text = encryptText.getBytes("UTF-8");
  rawHmac = mac.doFinal(text);
  let oauth = android.util.Base64.encodeToString(rawHmac, 2);
  return oauth;
}

名人名言

思路是最重要的, 其他的百度, bing, stackoverflow, github, 安卓文档, autojs文档, 最后才是群里问问
--- 牙叔教程

声明

部分内容来自网络
本教程仅用于学习, 禁止用于其他用途

相关实践学习

达摩院智能语音交互 - 声纹识别技术

声纹识别是基于每个发音人的发音器官构造不同，识别当前发音人的身份。按照任务具体分为两种：声纹辨认：从说话人集合中判别出测试语音所属的说话人，为多选一的问题声纹确认：判断测试语音是否由目标说话人所说，是二选一的问题（是或者不是）按照应用具体分为两种：文本相关：要求使用者重复指定的话语，通常包含与训练信息相同的文本（精度较高，适合当前应用模式）文本无关：对使用者发音内容和语言没有要求，受信道环境影响比较大，精度不高本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。讲师介绍：郑斯奇，达摩院算法专家，毕业于美国哈佛大学，研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。

autojs之语音转写

使用情景

效果展示

原理

难点

你将学到以下知识

代码讲解

签名计算过程

名人名言

声明

热门文章

最新文章

相关课程

相关电子书