文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasrr的autoModel里的input是有什么语音格式限制吗？

modelscope-funasrr的autoModel里的input是有什么语音格式限制吗？我用fastapi把语音文件转成bytes之后，Sensevoice里面自带的 "欢迎大家来体验达摩院推出的语音识别模型。"能识别出来，但是别的wav文件就不行。我下载到本地的sensevoice跑本地的文件都能出结果，但是fastapi上传文件就不行。

展开

收起

三分钟热度的鱼 2024-08-07 20:41:56 256 版权

1 条回答

写回答

取消提交回答

圆不溜秋的小猫猫

bytes没有音频头，funasr无法正确解析，你自己把bytes转采样点，具体，你可以去参考创空间的代码，funasr用的是三方sdk来load音频，任何sdk，也都需要音频头才能正确解析。此回答整理自钉群“modelscope-funasr社区交流”

2024-08-07 22:20:56

赞同 9 展开评论

相关问答

modelscope-funasr多线程调用AutoModel的时候出现这个，怎么解决？

481

0

0

在modelscope-funasr换了带时间戳的模型但是语音转出来的结果为什么没有时间戳呢？

443

0

0

modelscope-funasr的infer的时候input输入bytes类型，报错了，怎么解决？

226

1

0

modelscope-funasr的语音情感识别，如何离线部署？

307

0

0

modelscope-funasr有语音对话分离demo吗？

354

0

0

modelscope-funasr的vad模型对输入的语音长度是不是有最短时长的要求？

362

0

0

modelscope-funasr够支持直接在automodel类使用附加vad模型的参数吗？

376

0

0

modelscope-funasr这样生成的模型对语音的识别结果有没有影响，会不会降低识别率？

337

0

0

modelscope-funasr使用语音转写包有遇到丢字怎么解决？

218

0

0

modelscope-funasr这个模型的训练语音数据以及命令词列表有开源吗？

284

0

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

线下资金车手视角下 AI 语音钓鱼全链路风险与智能检测防御研究

AI 英语教学智能体开发

AI 英语口语 APP的开发

KET/PET 考试平台的开发

AI 英语在线考试平台的开发

热门讨论

热门文章

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

modelscope的palm模型，对联生成模型训练的src_text通过什么算法确定？

modelscope-funasr 热词如何设置？

modelscope-funasr如何释放显存呢？

langchain中llms.Tongyi 这个模型具体调用的是哪个通义模型

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

关于使用ModelScope离线启动已下载过的模型时遇到的问题

modelscope-funasr的sensevoice还不支持热词，是吗？

modelscope-funasr使用bytes类型数据传入，识别效果很差怎么解决？

达摩院用128张GPU烧出“中文版GPT-3”，我试了下，这文风不是开往幼儿园的车…

展开全部

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

OpenAI 12天发布会内容全纪录！一文快速回顾获知亮点信息，原文附发布会中文字幕视频

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

Botgroup.chat：超有趣的开源 AI 聊天室！多个 AI 在线互怼，一键搭建你的专属 AI 社群

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！

Jina Reader：一键将网页内容转为适合 LLM 处理的文本格式，自动抓取和清洗网页内容，支持多种输出格式

展开全部

还有其他疑问?