Paraformer语音识别 :语音识别过程中如何过滤一些拟声词,如额额、咳嗽、打呵欠、无内容等无效录音?
您好,Paraformer 语音识别目前不支持过滤一些拟声词,如额额、咳嗽、打呵欠等,不过您可以在数据预处理阶段将这些数据过滤掉。
以下是一个使用 Pandas 进行数据预处理的例子:
import pandas as pd
data = pd.read_csv('data.csv')
for idx, row in data.iterrows():
if row['transcript'] == '额额' or row['transcript'] == '咳嗽' or row['transcript'] == '打呵欠':
data.drop(idx, inplace=True)
data.to_csv('data_preprocessed.csv', index=False)
希望以上内容对您有所帮助。欢迎继续关注我们的后续更新。