备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

用这两个启动服务，在流式识别场景，modelscope-funasr两者效率差别大吗？

用 run_server_2pass.sh 启动服务和用 runtime/python/websocket/funasr_wss_server.py 启动服务，在流式识别场景，modelscope-funasr两者效率差别大吗？

展开

收起

三分钟热度的鱼 2024-01-24 16:27:57 260 版权

阿里云 AI 助理回答

在流式识别场景下，使用 run_server_2pass.sh 启动服务和使用 runtime/python/websocket/funasr_wss_server.py 启动服务的效率差异，主要取决于以下几个方面：

1. 服务启动方式与实现逻辑

run_server_2pass.sh
该脚本通常是一个封装好的启动工具，可能包含多阶段（two-pass）处理逻辑。它可能会对输入音频进行预处理、特征提取以及后处理等操作，适合需要高精度识别的场景。
- 特点：
- 可能会引入额外的计算开销，尤其是在两阶段处理中。
- 更适合对识别精度要求较高的任务，例如长语音或复杂背景噪声下的识别。
funasr_wss_server.py
这是一个基于 WebSocket 的 Python 实现的服务端脚本，主要用于实时流式语音识别。它的设计目标是低延迟和高吞吐量，适合实时性要求较高的场景。
- 特点：
- 更加轻量化，专注于流式数据的实时处理。
- 延迟较低，但可能在某些复杂场景下的识别精度略低于两阶段处理。

2. 性能对比

延迟
- 使用 funasr_wss_server.py 启动的服务通常具有更低的延迟，因为它直接处理流式数据，减少了中间步骤的开销。
- 而 run_server_2pass.sh 由于涉及两阶段处理，可能会增加一定的延迟，尤其是在处理较长音频时。
吞吐量
- funasr_wss_server.py 更适合高并发的流式识别场景，能够更好地利用系统资源处理多个 WebSocket 连接。
- run_server_2pass.sh 在高并发场景下可能会因为两阶段处理的复杂性而表现稍逊。
识别精度
- 如果任务对识别精度要求较高（如会议记录、语音转写等），run_server_2pass.sh 可能更适合，因为它可以通过两阶段处理提升识别效果。
- 对于实时性要求更高的场景（如语音助手、实时字幕生成等），funasr_wss_server.py 的精度通常已经足够。

3. 适用场景

run_server_2pass.sh
- 适用于对识别精度要求较高的离线或准实时任务。
- 适合处理长语音或复杂背景噪声下的语音识别任务。
funasr_wss_server.py
- 适用于实时性要求较高的流式语音识别任务。
- 适合需要快速响应的场景，如语音助手、实时字幕生成等。

4. 总结建议

如果您的应用场景对实时性要求较高，建议使用 funasr_wss_server.py 启动服务，以获得更低的延迟和更高的吞吐量。
如果您的应用场景对识别精度要求更高，或者需要处理复杂的语音数据，建议使用 run_server_2pass.sh 启动服务，以充分利用其两阶段处理的优势。

通过以上分析可以看出，两种启动方式在流式识别场景下的效率差异主要体现在延迟、吞吐量和识别精度上。具体选择哪种方式，应根据实际业务需求权衡取舍。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

相关问答

modelscope-funasr的paraformer-streaming微调代码是咋实现流式？

286

0

0

modelscope-funasr启动ASR服务的时候一直在提示ssl证书错误是咋回事？

564

1

0

modelscope-funasr的online流式实时听写，没有标点符号，需要如何设置？

318

0

0

modelscope-funasr的GPU离线转写服务的说话人识别模块要怎么配置啊？

261

0

0

请问modelscope上的语音合成模型可以流式输出吗？

170

1

0

modelscope里用vllm调用千问1.5-7b流式输出，没输出完就结束了，有限制输出多少字吗?

212

1

0

在modelscope-funasr中python客户端调用服务怎么没有采集语音呢？

102

1

0

在modelscope-funasr中手工启动服务如何操作有具体的文档吗?

86

0

0

modelscope-funasr的流式和非流式的区别在哪看？

211

1

0

在modelscope-funasr为什么流式和非流式要分成两个模型呢？

156

0

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

贝聿铭的 “数字续作”：蚂蚁百宝箱 × 苏州博物馆，用 AI 重构文化地标

Python 调用 Ozon 商品详情 API：请求构造与 JSON 响应处理完整案例

LBA-ECO ND-30 水化学，排除降雨，67 公里处，塔帕若斯国家森林

从零开始：用Python和Gemini 3四步搭建你自己的AI Agent

热门讨论

热门文章

modelscope-funasr 热词如何设置？

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

modelscope-funasr的html客户端的地址如何更改？

docker启动funasr-runtime-sdk-cpu-0.4.5

modelscope-funasr的sensevoice-Large有开源计划吗？

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

modelscope-funasr有没有开源的语音唤醒，自定义唤醒？

modelscope-funasr的int8的模型大概需要多少TOPS的算力？

modelscope-funasr这个进度条的日志去掉呢？

展开全部

中文大模型体验

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

最佳实践丨让苏东坡“复活”！我用Qwen3-8B实现了与千古文豪的跨时空对话

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

LLM 大模型学习必知必会系列(二)：提示词工程-Prompt Engineering 以及实战闯关

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！

展开全部

还有其他疑问?