文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr语音识别流式输出，paraformer支持的输入格式要求是啥呢？

modelscope-funasr的实时语音语音识别流式输出，paraformer支持的输入格式要求是啥呢？模型介绍里没写，是麦克风实时输入还是某种格式的语音文件呢，请大佬指定下，或者给个文档链接。

展开

收起

三分钟热度的鱼 2024-02-28 16:28:26 502 版权

1 条回答

写回答

取消提交回答

圆不溜秋的小猫猫

wav文件，采样点，麦克风bytes，pcm文件等，funasr1.0提倡大家自己去阅读代码哈，debug一下就知道了。此回答整理自钉群“modelscope-funasr社区交流”

2024-02-28 16:30:09

赞同展开评论

相关问答

modelscope-funasr的paraformer-streaming微调代码是咋实现流式？

520

0

0

modelscope-funasr的实时语音识别支持的并发数在哪里可以看？

626

1

0

modelscope-funasr系列，有直接输出srt格式的asr方案嘛？

364

1

0

modelscope-funasr的online流式实时听写，没有标点符号，需要如何设置？

507

0

0

在modelscope-funasr用的paraformer的一个语音识别模型，怎么加上热词？

517

0

0

modelscope-funasr的paraformer热词版本配置是不是不支持添加权重？

626

0

0

modelscope-funasr的paraformer推理的显存是有什么决定的，为啥会不太稳定？

460

1

0

modelscope-funasr的多说话人语音识别模型支持实时听写吗？

374

0

0

阿里巴巴语音实验室SAN-M网络结构和SCAMA流式Attention机制在语音识别中起什么作用？

1206

1

0

阿里语音AI实时语音识别 sdm 有个产品功能诉求：目前了解到没有API可以查询到即时占用的chan

1125

0

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

鸿蒙版本的小小机器人APP开放源码啦

AI 英语教育平台的开发

阿里云百炼产品月报【2026年7月】

Quick BI使用案例33：如何开启智能小Q语音问数功能？

阿里云百炼产品月报【2026年7月】

热门讨论

热门文章

【AdaSeq论文解读】COLING-22基于RaNER的垂直行业NER优化

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

modelscope-funasr用官方docker启动为什么只能用127.0.0.1链接wss？

如何修改通义千问的system prompt，以修改自定义名字

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

modelscope-funasr有说话人分离功能吗？

modelscope-funasr 热词如何设置？

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

modelscope-funasr针对默认参数CHUNK_SIZE=[5,10,5]，怎么办？

本地无法加载模型

展开全部

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

告别单轮静态测评！WorldForge 多动态环境基准，量化 Agent 组件协同能力

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

ImBD：复旦联合华南理工推出 AI 内容检测模型，快速辨别文本内容是否为 AI 生成

Archon – 开源 AI 智能体框架，自主生成代码构建 AI 智能体

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

展开全部

还有其他疑问?