modelscope-funasr跑offline模式，发现上一句的标点总在下一句的开头。怎么解决？

modelscope-funasr跑offline模式，发现结果里上一句的标点总在下一句的开头。怎么解决？环境：cpu-online-0.1.5, 执行的是run_server_2pass.sh使用的punc_model: "damo/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727-onnx"

展开

收起

三分钟热度的鱼 2024-01-10 16:32:44 285 版权

4 条回答

写回答

取消提交回答

1581430416294399

各种测试了，和我的情况是一模一样的，请问你的问题解决了吗？

2024-09-28 23:33:25

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
这个问题可能是由于模型在预测时，上一句的标点符号被错误地识别为下一句的开头。为了解决这个问题，你可以尝试以下方法：
1. 检查模型是否适用于离线模式。确保你的模型支持离线推理，并且已经正确加载了权重文件。
2. 调整模型的阈值。有时候，模型可能会将一些非常小的概率误判为标点符号。你可以尝试调整模型的阈值，以便更准确地识别标点符号。
3. 使用其他标点符号识别模型。如果上述方法都无法解决问题，你可以尝试使用其他标点符号识别模型，看看是否能获得更好的结果。
4. 检查数据预处理。确保你在预测之前正确地对音频进行了预处理，例如降噪、特征提取等。这些步骤可能会影响到模型的预测结果。
5. 更新模型和环境。确保你使用的是最新版本的模型和环境，以避免因版本不兼容导致的问题。
2024-01-13 14:38:02

赞同展开评论
sunrr
根据你的描述，你的问题可能是由于标点模型的输出位置不正确导致的。在offline模式下，标点模型应该在每一句话的结尾添加标点，而不是下一句话的开头。这可能是因为标点模型没有正确地识别出句子的边界。

为了解决这个问题，你可以尝试以下几种方法：
1. 调整标点模型：你可以尝试使用其他的标点模型，或者调整现有模型的参数，以提高其识别句子的准确性。
2. 使用更好的预训练模型：如果你的标点模型是在较少的训练数据上训练的，那么它可能无法很好地识别句子的边界。你可以尝试使用在大量数据上预训练的模型，以提高其性能。
3. 增加训练数据：如果你的标点模型是在较少的训练数据上训练的，那么你可以尝试增加训练数据，以提高其性能。
4. 使用更复杂的模型：如果你的标点模型是一个简单的模型，那么它可能无法很好地识别句子的边界。你可以尝试使用更复杂的模型，例如深度神经网络，以提高其性能。
5. 使用更复杂的预处理和后处理步骤：你可以尝试使用更复杂的预处理和后处理步骤，以提高标点模型的性能。例如，你可以尝试使用语言模型来纠正标点模型的错误。
希望以上建议能帮助你解决这个问题。如果你仍然遇到任何问题，建议你查阅模型的文档或者联系模型的维护者以获取更多的帮助。
2024-01-12 11:47:35

赞同展开评论
圆不溜秋的小猫猫

标点模型需要上下文，需要右看，所以会在下一句的开头。此回答整理自钉群“modelscope-funasr社区交流”

2024-01-10 17:03:19

赞同展开评论

modelscope-funasr跑offline模式，发现上一句的标点总在下一句的开头。怎么解决？

ModelScope模型即服务

热门讨论

热门文章