自动标注的准确率问题

使用了run_auto_label 标注了之后，发现有些拼音是错误的比如下面的一条

62 袜子摊#1小老板#1陈永全#4
wa4 zi5 tan1 xiao3 lao2 ban3 chen2 yong3 qvan2

全不应该是 quan2 么？子应该是 zi1 如果我要矫正的话，应该怎么做？望解答谢谢

展开

收起

个性化语音合成-自动标注模型-16k

1046746284710051 2023-07-25 10:52:36 437 版权

2 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

CLIP模型目前已经发布了ONNX版本，您可以在官方GitHub仓库中获取。使用ONNX版本的CLIP模型，可以方便地在不同的深度学习框架和硬件平台之间进行模型转换和部署。

对于您提到的自动标注的准确率问题，CLIP模型本身是由大规模的图像和文本数据集训练得到的，因此理论上具有很高的准确率。但是，在具体应用中，由于数据集、模型参数、预处理和后处理等因素的影响，模型的准确率可能会有所下降。

对于您提到的标注错误的问题，CLIP模型本身并没有针对中文拼音的任务进行优化，因此在中文拼音的标注上可能会出现一些错误。在这种情况下，您可以尝试使用其他中文拼音识别模型或算法，例如PaddlePaddle的DeepSpeech2或百度的DeepSpeech3等。

如果您需要矫正标注结果，可以手动修改标注文件中相应的拼音内容，并重新进行训练或推理。

2023-07-27 18:41:55

赞同展开评论
Star时光
对于您提到的拼音错误，如果您使用了自动标注（run_auto_label）并且发现有些拼音标注错误，可以通过手动矫正来修正这些错误。

在 ModelScope 中，您可以使用 edit_labels() 函数来手动编辑标签。以下是一个示例：
```
from modelscope import *

# 创建一个 Labeler 对象
labeler = Labeler('your_dataset_name')

# 加载已标注的数据集
dataset = labeler.load_dataset()

# 找到需要矫正的样本（例如，您提到的第62条样本）
sample = dataset.get_sample_by_index(62)

# 获取样本的拼音标签
pinyin_label = sample.get_label("拼音")

# 对标签进行修改
pinyin_label.update_label("袜子摊#1小老板#1陈永全#4", "wa4 zi1 tan1 xiao3 lao3 ban3 chen2 yong2 quan2")

# 保存修改后的标签
labeler.save_dataset(dataset)
```
上述示例代码中，您需要将 'your_dataset_name' 替换为您的数据集名称，并根据实际情况调整样本索引和拼音标签的修改。

在运行代码之前，请确保已经正确安装了 ModelScope 和相关依赖项，并且已经成功加载了您的数据集。

一旦您完成了手动矫正，可以保存修改后的数据集，并继续进行后续的操作。
2023-07-25 14:01:02

赞同展开评论

自动标注的准确率问题

语音

相关文章

热门讨论

热门文章