Paraformer语音识别 :语音识别过程中如何过滤一些拟声词,如额额、咳嗽、打呵欠、无内容录音?

Paraformer语音识别 :语音识别过程中如何过滤一些拟声词,如额额、咳嗽、打呵欠、无内容等无效录音?

展开
收起
游客dbi5eawq6iilm 2023-08-18 10:26:32 420 分享 版权
2 条回答
写回答
取消 提交回答
  • 请教一下:
    如果读取连续数字,怎么能识别出断句呢?
    比如:2.3, 6.77, 69.08,....

    2023-11-13 14:13:32
    赞同 展开评论
  • 您好,Paraformer 语音识别目前不支持过滤一些拟声词,如额额、咳嗽、打呵欠等,不过您可以在数据预处理阶段将这些数据过滤掉。

    以下是一个使用 Pandas 进行数据预处理的例子:

    import pandas as pd

    读取数据

    data = pd.read_csv('data.csv')

    过滤拟声词

    for idx, row in data.iterrows():
    if row['transcript'] == '额额' or row['transcript'] == '咳嗽' or row['transcript'] == '打呵欠':
    data.drop(idx, inplace=True)

    保存数据

    data.to_csv('data_preprocessed.csv', index=False)
    希望以上内容对您有所帮助。欢迎继续关注我们的后续更新。

    2023-09-26 10:25:19
    赞同 展开评论

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理