文档备案控制台

开发者社区 ModelScope模型即服务正文

modelscope-funasr哪位大神测试过8K的wav录音文件识别？

modelscope-funasr哪位大神测试过8K的wav录音文件识别，是直接让软件包识别，还是重采样到16k后，再识别效果更好呢？

展开

收起

嘟嘟嘟嘟嘟嘟 2024-01-05 07:58:12 484 版权

3 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

对于8K的wav录音文件，modelscope-funasr具有处理的能力。它支持多种音频格式进行推理，包括PCM和WAV文件。因此，无论您的音频文件是存储在本地的WAV文件，还是存储在URL中的WAV文件，都可以通过FunASR进行处理。只需将音频文件的路径或URL传递给相应的API接口，就可以实现音频的识别和处理。同时，如果有大量的音频需要进行批量处理，也可以通过上传文件夹的方式，一次性对多个音频文件进行处理，这大大提高了效率。

2024-01-06 12:40:21

赞同展开评论
sunrr

对于8K的wav录音文件，直接让modelscope-funasr进行识别应该是可行的。不过，由于FunASR模型在设计时可能更适应标准的音频采样率，如16kHz，因此，如果想得到更好的识别效果，你可能需要将8K的音频重采样到16k后再进行识别。这样能确保音频的频率内容在模型可处理的范围内，从而提高语音识别的准确性。当然，这需要您根据实际情况进行尝试和调整。

2024-01-05 09:04:32

赞同展开评论
番茄酱脑袋

mac录音，用8K采样率出现很重的破音。不过机器识别没问题。此回答整理自钉群“modelscope-funasr社区交流”

2024-01-05 08:19:48

赞同展开评论

相关问答

ModelScope中， llm生成的图谱如何修改和测试呢？

193

0

0

modelscope-funasr这个1200+的测试结果，是不是用了2张A10的显卡呀？

307

1

0

ModelScope中，更新了ms-swift,刚测试的结果如图，怎么办？

344

1

0

modelscope-funasr录音的wav文件保存路径在哪设置呢？

242

1

0

modelScope中，eval性能测试中图中两个参数有没有样例给看看？

330

0

0

请问ModelScope中，jupyter里测试代码时，可以发布一个接口对外开放吗？

188

1

0

modelscope-funasr的android的demo测试为什么没有反应？

241

0

0

ModelScope中使用开源的千问1_8预训练模型微调后测试模型的时候报错，怎么解决？

471

0

0

ModelScope使用中文摘要，使用什么基准测试集比较合适呢？

165

0

0

modelscope-funasr的wav格式 8K 16bit 双声道的开源asr测试数据地有吗？

330

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

cuda 是11.3，ModelScope的mmcv怎么安装？

ModelScope下载速度慢怎么解决？

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope镜像地址是什么？

ModelScope这个免费额度可以在哪里查询啊？

ModelScope cuda装成功了用pipeline还是cpu咧？

使用创空间docke构建部署项目，构建成功，运行日志显示后端启动，但是前端无法连接

展开全部

中企投资印度新能源“有戏”吗？

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Claude Code 四大定制机制完全指南：CLAUDE.md、Hooks、Skills、Subagents 怎么选怎么用

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

Gemini 3.5 Pro 泄露刷屏！前端一次成型赶超 Fable 5，7 月 17 日或将亮相

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

Hermes Agent：深度技术剖析报告

Codex 完整避坑指南（2026 版）：沙箱、权限、AGENTS.md、Worktree 七类坑一次讲清

展开全部

还有其他疑问?