文档备案控制台

开发者社区 ModelScope模型即服务正文

modelscope-funasr为啥uniasr输出的结果有些会叠字啊？比如"好好好好好好好"。

modelscope-funasr为啥uniasr输出的结果有些会叠字啊？比如"好好好好好好好"，"对对对对对对对"这种。

展开

收起

嘟嘟嘟嘟嘟嘟 2023-12-27 10:56:19 289 版权

阿里云 AI 助理回答

在使用ModelScope-FunASR的UniASR模型时，如果输出结果中出现叠字现象（例如"好好好好好好好"或"对对对对对对对"），这通常是由于以下几个原因导致的：

1. 解码策略问题

UniASR模型在生成文本时依赖于解码算法，而解码过程中可能会因为**温度参数（temperature）设置过低或束搜索（beam search）**宽度不足，导致模型倾向于选择高概率的重复词。
解决方法：
- 调整解码参数，例如增加temperature值（如设置为0.7~1.0），以引入更多的随机性，避免模型过于保守地选择高概率词。
- 如果使用束搜索，可以适当增加beam size，以探索更多可能的候选序列。

2. 训练数据中的偏差

如果训练数据中存在大量重复模式（例如某些语音片段中频繁出现叠字现象），模型可能会学习到这种模式并在生成时过度拟合。
解决方法：
- 检查训练数据分布，确保数据多样性，避免单一模式占据主导。
- 在微调模型时，加入更多多样化的语料，减少对特定模式的依赖。

3. 输入音频的质量问题

输入音频可能存在噪声、断续或重复片段，导致模型误判并生成重复的文本。
解决方法：
- 对输入音频进行预处理，例如降噪、分割和标准化，确保音频质量较高。
- 使用高质量的麦克风或录音设备采集音频，避免因硬件问题导致的信号失真。

4. 后处理逻辑缺失

模型生成的结果可能未经过有效的后处理，导致重复内容未被过滤或修正。

解决方法：

在模型输出后添加后处理逻辑，例如检测连续重复的字符或词语，并对其进行去重或修正。

示例代码：

def remove_repeated_words(text):
   import re
   # 匹配连续重复的词语
   return re.sub(r'\b(\w+)\1{2,}\b', r'\1', text)

result = "好好好好好好好"
cleaned_result = remove_repeated_words(result)
print(cleaned_result)  # 输出：好

5. 模型版本或配置问题

如果使用的UniASR模型版本较旧，可能存在已知的生成问题。建议检查是否有更新版本或优化后的配置文件。
解决方法：
- 更新到最新版本的ModelScope-FunASR工具包，并参考官方文档调整配置参数。
- 确保安装了所有必要的依赖项，并按照官方推荐的方式进行部署和调用。

总结与建议

叠字问题通常是由解码策略、训练数据偏差、输入音频质量或后处理逻辑不足引起的。建议从以上几个方面逐一排查，并根据实际情况调整参数或优化流程。如果问题仍然存在，可以尝试联系ModelScope社区或提交Issue，获取更专业的技术支持。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

相关问答

在modelscope-funasr中uniASR是不是停止维护了?

304

1

0

modelscope-funasr的uniasr类的exampledata例子有吗？

229

1

0

modelscope-funasr这个微调uniasr闽南语版本问题怎么解决？

314

1

0

modelscope-funasr怎么通过automodel()加载uniasr的方言模型？

276

1

0

modelscope-funasr的uniasr的粤语模型怎么转onnx？

319

0

0

modelscope-funasr和uniasr一样吗？

147

0

0

docker部署的modelscope-funasr语音在线识别服务支持UniASR模型不？

296

0

0

modelscope-funasr的UniASR 中文方言离线版现在可以调用吗？

171

0

0

modelscope-funasr的uniasr模型目前支持onnx导出吗？

237

1

0

modelscope-funasr中，不用uniasr，fuasr小语种，有模型吗？

238

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

ModelScope镜像地址是什么？

ModelScope下载速度慢怎么解决？

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

cuda 是11.3，ModelScope的mmcv怎么安装？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这个免费额度可以在哪里查询啊？

IndexTTS 部署报错：No module named 'tn'

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

展开全部

中企投资印度新能源“有戏”吗？

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

2026 最新Stable Diffusion 本地部署教程下载安装使用详细图解（含官网安装包）

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

docker安装部署FunASR

HTTPS 原理

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

展开全部

还有其他疑问?