开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

modelscope-funasrr的autoModel里的input是有什么语音格式限制吗?

modelscope-funasrr的autoModel里的input是有什么语音格式限制吗?我用fastapi把语音文件转成bytes之后,Sensevoice里面自带的 "欢迎大家来体验达摩院推出的语音识别模型。"能识别出来,但是别的wav文件就不行。我下载到本地的sensevoice跑本地的文件都能出结果,但是fastapi上传文件就不行。

展开
收起
三分钟热度的鱼 2024-08-07 20:41:56 34 0
1 条回答
写回答
取消 提交回答
  • bytes没有音频头,funasr无法正确解析,你自己把bytes转采样点,具体,你可以去参考创空间的代码,funasr用的是三方sdk来load音频,任何sdk,也都需要音频头才能正确解析。 此回答整理自钉群“modelscope-funasr社区交流”

    2024-08-07 22:20:56
    赞同 9 展开评论 打赏

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

热门讨论

热门文章

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载