百度语音识别REST API——通过使用Http网络请求方式获得语音识别功能

简介:

百度语音识别通过REST API的方式给开发人员提供一个通用的HTTP接口,基于该接口,开发人员能够轻松的获取语音识别能力,本文档描写叙述了使用语音识别服务REST API的方法。

长处:

较之开发人员经常使用的获取语音识别功能的方法,本方法最大的优势是轻量级。不须要在所开发的应用中集成不论什么SDK开发工具包,也不须要在測试机中加入不论什么识别引擎软件,开发人员仅仅要了解Http网络请求以及百度语音识别 REST API的使用规则。就可以轻轻松松在自己的应用中使用语音识别相关的功能了。

功能介绍:

REST API支持整段录音文件的识别,对录音格式有一定的要求。支持语音识别控件:集成提示音、音量反馈动效整套交互的对话框控件,方便开发人员高速集成。

原始PCM的录音參数必须符合8k/16k採样率、16bit位深、单声道。支持的压缩格式有:pcm(不压缩)、wav、opus、speex、amr、x-flac。

用法:

注冊开放平台及创新应用

注冊方法可參见之前写的百度语音识别开放平台SDK用法一文。当中有具体的注冊方法叙述。

从管理控制台进入创建的应用,例如以下图所看到的,API Key(client_id)和Secret Key(client_secret)即显示于当中, ID即为应用id(appid)。

依据百度OAuth的Client Credentials授权方式获取access_token。百度OAuth的Client Credentials和其它授权方式的说明见百度OAuth介绍的“百度支持的OAuth授权”部分。


当中,grant_type的值固定为client_credentials,client_id即为(3)中截图所看到的的 API Key的值,client_secret即为截图所看到的的Secret Key的值。更为具体的介绍请參见Client Credentials授权说明。
响应例如以下所看到的,当中access_token字段即为请求REST API所需的令牌, access_token有效期一般为一个月,开发人员须要对access_token。进行有效性推断,过期需又一次申请access_token。



API请求方式

 语音识别接口支持POST 方式
 眼下API仅支持整段语音识别的模式,即须要上传整段语音进行识别
 语音数据上传方式有两种:隐示发送和显示发送
 原始语音的录音格式眼下仅仅支持评測8k/16k採样率16bit位深的单声道语音
 压缩格式支持:pcm(不压缩)、wav、opus、speex、amr、x-flac
 系统支持语言种类:中文(zh)、粤语(ct)、英文(en)
 正式地址:http://vop.baidu.com/server_api

语音上传模型

语音数据和其它參数通过标准JSON格式串行化POST上传。 JSON里包含的參数:




当中。开发人员能够把语音数据放在JSON序列的“speech”字段中,须要将语音先进行base64编码,并标明语音数据的原始长度。填写“len”字段。也能够直接提供语音下载地址放在“url”字段中。而且提供识别结果的回调地址。放在“callback”參数中。因此“speech”和“len”參数绑定,“url”和“callback”參数绑定,这张组參数二选一填写。假设都填。默认处理第一种。



表单类型在HTTP-HEADER里的content-type表明,例:


Content-length请填写JSON串的长度。
 上传实例:


 注意事项:
1, len字段表示原始语音长度。不是base64编码之后的长度。
2, speech和len字段绑定验证,url和callback绑定验证。两组參数二选一必填。假设都填,默认第一种方式。
3。 假设採用base64编码语音数据。数据量会增大1/3。
 显示发送:
语音数据直接放在HTTP-BODY中,控制參数以及相关统计信息通过REST參数传递。REST參数说明:



语音数据的採样率和压缩格式在HTTP-HEADER里的content-type表明,例:


Content-length请填写原始语音长度。
 URL演示样例:


下行接口定义

两种上传方式都返回统一的结果,採用 JSON格式封装。假设识别成功,识别结果放在JSON的“result”字段中,统一採用utf-8方式编码。



 识别成功返回case:
{\"err_no\":0,\"err_msg\":\"success.\",\"corpus_no\":\"15984125203285346378\",\"sn\":\"481D633F-73BA-726F-49EF-8659ACCC2F3D\",\"result\":[\"\\u6211\\u633a\\u5e05\\u554a\\uff0c\\u5e05\\u54e5\\uff0c\"]}
 识别错误返回case:
{"err_no":2000,"err_msg":"data empty.","sn":null}

错误码解释
33xx:系统内部模块交互错误,服务此时可能不太稳定。
34xx:參数错误,请检查上行參数。
30xx-32xx:后端错误。后端资源可能出现错误


因为篇幅所限,详细用法在下篇文章介绍。





本文转自mfrbuaa博客园博客,原文链接:http://www.cnblogs.com/mfrbuaa/p/5372192.html,如需转载请自行联系原作者  

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
3月前
|
架构师 安全 物联网
Apipost vs Apifox:高效API协作的差异化功能解析
作为企业级API架构师,深度体验APIPost与Apifox后发现几大亮点功能。目录级参数配置避免全局污染;WebSocket消息分组提升长连接管理效率;Socket.IO支持解决特定协议需求;接口锁定保障团队协作安全。大型团队适合APIPost的细粒度管控,复杂物联网项目需WebSocket分组,维护遗留系统离不开Socket.IO支持,初创团队可按需灵活选择。这些特性显著优化开发协作质量。
|
3月前
|
API 开发者 Python
如何在API中实现搜索和过滤功能
本文介绍了如何为API添加搜索和过滤功能,使其更强大灵活。通过Flask示例,展示了按书名搜索、按作者或年份过滤书籍的方法,并结合两者实现复合查询。同时,提供了搜索不区分大小写、支持多过滤器组合、分页和输入验证等最佳实践。最后推荐了Apipost工具,它能简化API调试、负载测试及文档生成,提升开发效率。这些功能帮助用户更好地控制数据,优化API使用体验。
|
3月前
|
存储 前端开发 JavaScript
调用DeepSeek API增强版纯前端实现方案,支持文件上传和内容解析功能
本方案基于DeepSeek API增强版,提供纯前端实现的文件上传与内容解析功能。通过HTML和JavaScript,用户可选择文件并调用API完成上传及解析操作。方案支持多种文件格式(如PDF、TXT、DOCX),具备简化架构、提高响应速度和增强安全性等优势。示例代码展示了文件上传、内容解析及结果展示的完整流程,适合快速构建高效Web应用。开发者可根据需求扩展功能,满足多样化场景要求。
1162 64
|
1月前
|
搜索推荐 数据管理 API
电商 API 接口功能:赋能电商高效发展的强劲引擎
电商API接口是数字化时代提升电商效率与体验的关键工具。它可实现商品数据管理(如信息获取、实时更新与精准搜索)、订单处理(如创建支付、状态跟踪及客户信息分析)以及营销推广(如促销对接与广告监测)。这些功能助力企业降低成本、优化运营,并在竞争中占据优势,为电商业务发展开辟广阔空间。
40 0
|
3月前
|
JSON API 数据格式
一文读懂天猫商品详情 API 接口:功能、调用与实战攻略
天猫商品详情API为电商从业者、开发者和数据分析人员提供高效的商品数据获取途径。通过输入商品ID,可获取商品基本信息(名称、品牌等)、价格信息(售价、促销价等)、库存状态、商品描述及图片链接等详细内容。本文还提供了Python调用示例,包含签名生成、参数构建与请求发送等功能,帮助用户快速集成API,满足定价优化、市场分析等需求。使用时需替换示例中的AppKey与商品ID,并遵守平台规范。
222 16
|
3月前
|
JSON API 开发者
天猫商品详情 API 接口:功能、调用与实战攻略
天猫商品详情API为电商从业者、开发者和数据分析人员提供高效的商品数据获取途径。通过商品ID,该接口可返回包括基本信息、价格、库存及图片等详细内容,具有高准确性、易集成和功能丰富的特点。示例代码展示了如何用Python调用此API,生成签名确保请求安全,助力用户优化定价策略、开发应用或分析市场趋势。
166 10
|
4月前
|
供应链 搜索推荐 API
一文读懂:京东、淘宝、拼多多 API 接口,功能大不同,场景各有招
本文深入解析京东、淘宝、拼多多三大电商巨头的API接口特点与差异。京东API以商品管理、订单处理和物流跟踪见长,适合电商平台及零售商;淘宝API功能丰富,涵盖商品查询、订单管理与用户认证,适用多场景电商业务;拼多多API聚焦社交电商,提供拼团、砍价等特色玩法,助力商家提升曝光与销量。开发者和商家需根据自身需求选择合适的API接口,并关注其安全性与稳定性。随着技术进步,这些API将持续优化,推动电商行业蓬勃发展。
|
3月前
|
人工智能 自然语言处理 搜索推荐
WordPress AI 原创文章自动生成插件,新增自定义生成图片API功能,支持自定义99%的生图API,拓展性超强
这是一款功能强大的WordPress AI原创文章自动生成插件,支持两种智能生成模式:传统自动方式和懒人智能方式。通过AI生成长尾关键词、多语言文章、动态化标题与内容结构,优化SEO效果,去AI特征,吸引更多点击。插件可自动生成配图、TAG标签及摘要,支持24小时无人值守自动化生成文章,并提交至各大搜索引擎。同时提供关键词管理、定时任务、API集成等功能,兼容主流AI模型,助力网站内容创作与SEO优化。适合个人站长及企业用户提升内容生产力。
|
4月前
|
存储 编解码 资源调度
鸿蒙相机开发实战:从设备适配到性能调优 —— 我的 ArkTS 录像功能落地手记(API 15)
本文分享鸿蒙相机开发经验,从环境准备到核心逻辑实现,涵盖权限声明、模块导入、Surface关联与分辨率匹配,再到录制控制及设备适配法则。通过实战案例解析,如旋转补偿、动态帧率调节和编解码优化,帮助开发者掌握功能实现、设备适配与体验设计三大要点,减少开发坑点。适合鸿蒙新手及希望深化硬件交互能力的工程师参考收藏。
178 2
|
3月前
|
人工智能 缓存 前端开发
通过API接口实现1688图片搜索商品功能全攻略
本文详细介绍如何通过API接口实现1688图片搜索商品功能,并对接至自有系统。核心流程包括:用户上传图片后,利用百度AI图像识别API提取特征并生成关键词,再调用1688开放平台的商品搜索接口获取结果。技术方案采用Python开发,涵盖前端交互设计与后端集成要点,如接口服务化、缓存机制及异常处理。此外,文章还提供了性能优化建议和数据解析示例,适用于电商平台及多种扩展场景。

热门文章

最新文章