modelscope-funasr为啥uniasr输出的结果有些会叠字啊?比如"好好好好好好好","对对对对对对对"这种。
在使用ModelScope-FunASR的UniASR模型时,如果输出结果中出现叠字现象(例如"好好好好好好好"或"对对对对对对对"),这通常是由于以下几个原因导致的:
temperature
值(如设置为0.7~1.0),以引入更多的随机性,避免模型过于保守地选择高概率词。beam size
,以探索更多可能的候选序列。解决方法:
示例代码:
def remove_repeated_words(text):
import re
# 匹配连续重复的词语
return re.sub(r'\b(\w+)\1{2,}\b', r'\1', text)
result = "好好好好好好好"
cleaned_result = remove_repeated_words(result)
print(cleaned_result) # 输出:好
叠字问题通常是由解码策略、训练数据偏差、输入音频质量或后处理逻辑不足引起的。建议从以上几个方面逐一排查,并根据实际情况调整参数或优化流程。如果问题仍然存在,可以尝试联系ModelScope社区或提交Issue,获取更专业的技术支持。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352