开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

modelscope-funasr的sensevoice支持识别长音频文件输出分句级别的起始时间吗?

modelscope-funasr的sensevoice支持识别长音频文件(1分钟以上),输出分句级别的起始时间、结束时间、句子内容吗?
像这样的效果:“Start: 5.42s, End: 8.28s, Text: 当然这对普通民众来说有认知偏差”,而不是这样的“Start: 40.12s, End: 48.12s, Text: 虽然我们说他们是依照消耗品生产的,但机械化程度高的产品永远比电子程度高的产品拥有更长的生命周期。”

展开
收起
三分钟热度的鱼 2024-07-17 23:07:48 39 0
1 条回答
写回答
取消 提交回答
  • 如果只是中文识别需求,可以先用paraformer-zh,sensevocie主要是支持多语言,中文效果没有paraformer好 此回答整理自钉群“modelscope-funasr社区交流”

    2024-07-18 08:53:15
    赞同 6 展开评论 打赏

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载