文档备案控制台

开发者社区问答正文

阿里语音AI实时语音识别的接口，通过浏览器获取到的语言流，传过去无法正常的识别到文字。怎么处理？

阿里语音AI实时语音识别的WebSocket接口，用react开发，通过浏览器获取到的语言流，传过去无法正常的识别到文字。怎么处理？

展开

收起

三分钟热度的鱼 2023-05-29 14:43:31 406 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

圆不溜秋的小猫猫

https://help.aliyun.com/document_detail/324262.html?spm=a2c4g.84424.0.0.4adb5398XGX8sE 可以看下协议里的音频流 WebSocket协议对外提供实时语音流语音转写功能，支持长语音。其中指令、事件皆为WebSocket协议Text类型的DataFrame，音频流需要以Binary Frame的形式上传至服务端，调用时序需要符合协议要求的交互流程。发送语音数据使用Websocket的二进制帧BinaryFrame，具体可参见Data Frames。此回答整理自钉群“阿里语音AI【6群】”

2023-05-29 14:50:49

赞同展开评论

问答分类：

人工智能前端开发语音技术智能语音交互智能语音交互

问答标签：

AI浏览器 AI阿里 AI语言阿里AI AI语音

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

阿里云语音AI对话人AB，如何识别说话人？

476

2

0

阿里语音AI的前端项目可以集成语音合成编辑器吗？

290

1

0

请问阿里RPA启动chrome浏览器的无痕模式怎么启动？

305

2

0

在阿里函数计算中，部分地区访问函数计算的服务，浏览器显示链接已重置该怎么处理？

135

1

0

在阿里函数计算中，测试域名地址一直可以用，为啥浏览器打开有时候能用有时候不能用是为什么？

227

1

0

在阿里语音AI中，cosyvoice声音复刻可以用于阿里云智能媒体服务合成么？

365

1

0

语音AI技术在未来可能解锁的下一个场景是什么？

180

1

0

阿里云语音AI CosyVoice 声音复刻，现在支持多少种语言呀？

376

1

0

阿里云语音AI在用流式tts 我调用停止转换的方法后还是要待到音频都返回后才停止能立刻停止吗

331

1

0

阿里云语音AI控制台可以定制人声，是不是就没有拟人度的区别？

330

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

关于国际版和国内版客户端购买套餐问题

Pro试用版是只有300的Credits么？

Qoder REPO WIKI使用优化

idea qoder cn报错

qoder cn 积分为什么消耗这么快???

相关文章

阿里云百炼Coding Plan完整指南：计费价格、请求次数、使用教程及免费Tokens领取指南

2026 GOAI 世界人工智能开源大赛—新智基座 Agent Infra 赛道正式启动！ ¥190万总奖池等你挑战!

我们缺少一个词，来描述 Agent 开始替人操作业务系统这件事

阿里云服务器ECS新手指南：优势、ECS实例规格族、使用场景、活动及配置选择攻略

2026企业如何应用数据中台？让数据真正产生业务价值

相关解决方案

更多

AI 视频翻译：打破语言壁垒，连接全球观众

阿里云百炼专属版 AI Stack 一体机

在 App 上搭建开箱即用的 AI 助手

在网站上增加一个 AI 助手

在聊天系统中增加一个 AI 助手

还有其他疑问?