文档备案控制台

开发者社区问答正文

通义语音实验室提出的Paraformer语音识别声学模型有哪些主要特点和优势？

通义语音实验室提出的Paraformer语音识别声学模型有哪些主要特点和优势？

展开

收起

夹心789 2024-06-24 20:00:45 817 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

通义语音实验室提出的Paraformer语音识别声学模型的主要特点和优势包括：
1.非自回归模型：相比于主流的自回归模型，Paraformer可以并行地对整条句子输出目标文字，特别适合利用GPU进行并行推理。
2.推理效率提升：相同模型参数规模的Paraformer和Transformer相比，Paraformer结合GPU推理效率可以提升5～10倍。
3.性能与自回归模型相当：Paraformer是当前已知的首个在工业大数据上可以获得和自回归端到端模型相同性能的非自回归模型。
4.应对两大核心问题：通过Predictor预测文字个数并使用CIF机制抽取声学隐变量，以及基于GLM的Sampler模块增强对上下文语义的建模，解决了非自回归模型面临的核心问题。

2024-06-24 20:30:24

赞同 1 展开评论

问答分类：

语音技术智能语音交互智能语音交互

问答标签：

智能语音交互语音智能语音交互模型语音智能语音交互 paraformer智能语音交互 paraformer智能语音交互模型

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

qwen3-asr-flash 模型的HTTP API接口不支持本地文件上传吗？

426

1

0

使用 dashscope-sdk-java 调用qwen3-max-preview模型回答问题，没有

508

0

0

C-MTEB评估qwen模型

448

0

0

怎么使用vllm部署最新的qwen3的mbedding 和reranker模型呢

1161

0

0

通义灵码能不能自定义LLM模型？

959

1

0

使用qwen-mt-turbo模型的openapi限流如何解除

1417

0

0

qwen模型微调上传数据集时，如何书写数据集的本地路径？

404

0

0

qwen-long模型

366

1

0

vscode集成通义灵码后，使用deepseek模型，会经常遇到连接超时的情况

665

2

0

Unichat - qwen2.5 - 32B - c1 模型已经下载下来在运行python报错

365

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

需要支持自定义Kimi k3 API

WordPress站点怎么进行速度优化？

电脑下载有https证书问题，浏览器有时加载不出网页显示ERR_SSL_VERSION_OR_CIP

Qoder如何自主打开浏览器？

关于国际版和国内版客户端购买套餐问题

相关文章

培训管理系统bizLearnify的 AI 智能陪练完整功能逻辑，以家电门店销售为例的剧本框架

把 AI 视频剪辑搬进浏览器：Timeline Studio 的本地优先架构与工程实践

阿里云Token Plan支持哪些AI模型？个人版和团队版有区别吗？

传统IVR与大模型语音机器人：意图识别准确率与接通率的实测对比

AI 语音克隆仿冒管理者语音钓鱼攻击机理与校园闭环防御研究

相关解决方案

更多

通义灵码一站式定制专属MCP服务

GLM-5.2：长任务时代开源旗舰模型

基于 Spark 和 PyTorch 的模型训练方案

告别低效沟通，使用大模型发起语音通话

OpenAI 重磅开源，快速部署GPT-OSS模型

还有其他疑问?