开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

modelscope-funasr语音识别流式输出,paraformer支持的输入格式要求是啥呢?

modelscope-funasr的实时语音语音识别流式输出,paraformer支持的输入格式要求是啥呢?模型介绍里没写,是麦克风实时输入还是某种格式的语音文件呢,请大佬指定下,或者给个文档链接。

展开
收起
三分钟热度的鱼 2024-02-28 16:28:26 110 0
1 条回答
写回答
取消 提交回答
  • wav文件,采样点,麦克风bytes,pcm文件等,funasr1.0提倡大家自己去阅读代码哈,debug一下就知道了。此回答整理自钉群“modelscope-funasr社区交流”

    2024-02-28 16:30:09
    赞同 展开评论 打赏

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

热门讨论

热门文章

相关电子书

更多
阿里云总监课第二期——IoT时代的语音交互智能 立即下载
阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
智能语音交互:阿里巴巴的研究与实践 立即下载