备案控制台

开发者社区 ModelScope模型即服务正文

modelscope-funasr如何设置params.batch_bins 这个值？

我在finetune "speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online"这个模型，语音数据一共800条，10s以内的一句话音频；

按照我自己的理解params.batch_bins 这个参数应该是一个比较固定的值
想问一下，modelscope-funasr如何设置params.batch_bins 这个值？

展开

收起

嘟嘟嘟嘟嘟嘟 2024-01-04 23:16:02 159 版权

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

在modelscope-funasr中，params.batch_bins这个参数用于设置每个批次的音频长度。通常情况下，我们可以根据实际的语音数据和硬件资源来设置这个值。

如果你的语音数据是10秒以内的一句话音频，那么可以将params.batch_bins设置为10000（单位为采样点数）。这样，每个批次的音频长度就是10秒，可以满足你的需求。

如果你的语音数据长度不一致，或者需要对不同长度的音频进行不同的处理，那么你可能需要根据实际情况调整params.batch_bins的值。例如，你可以将较短的音频分到较小的批次中进行处理，以减少内存占用和计算资源的需求。

需要注意的是，params.batch_bins的值设置得过大可能会导致内存占用过高，而设置得过小可能会导致处理速度较慢。因此，你需要根据实际需求和硬件资源来合理设置这个参数。

2024-01-05 10:02:44

赞同展开评论
番茄酱脑袋

和你的显存有关系哈，默认11GB显存，如果你的比较大，可以增大params.batch_bins哈，这个的大小不影响收敛的结果，只影响训练的显存和速度。此回答整理自钉群“modelscope-funasr社区交流”

2024-01-04 23:28:14

赞同展开评论

相关问答

modelscope-funasr有没有配置项可以设置cpu大小？

495

13

0

modelscope-funasr部属完成后，发生错误。可是用demo没有问题。该怎么设置？

129

1

0

modelscope-funasr设置这个单位长度是什么参数？

368

1

0

modelscope-funasr实时识别的录音片段设置好多ms效果更好呢？

175

1

0

ModelScope创空间没有看见设置，怎样”换个python3.10的镜像“？

155

1

0

modelscope设置数据集为什么就直接报错了呢？

174

1

0

ModelScope怎么设置controlnet的Control Weight？

93

1

0

modelscope-funasr怎么设置使用指定的显卡计算吗？

214

1

0

ModelScope认证有办法关闭吗？还是需要去设置证书？

237

2

0

怎么设置可以实现合并￥量化后的ModelScope模型的group_size=64呢？

176

2

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中apikey在哪申请？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

com/action/joingroup?code=v1是什么意思

关于 Windows平台上 ttsfrd 库的问题。

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

展开全部

Z-Image：冲击体验上限的下一代图像生成模型

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

共学 | 2025年，更加有效地搭建Agent

中文大模型体验

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Agent Skills技术协议与开源实现，让大模型拥有“即插即用”技能

Z-Image Turbo LoRA训练魔法：如何保持加速生图能力

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Meta SAM3开源：让图像分割，听懂你的话

通义百聆语音双子星，同步开源！

展开全部

还有其他疑问?