请问PAI-DSW中使用EasyASR进行语音识别流程大概是怎样的?
1.步骤一:准备数据 下载语音识别的训练数据。
2.步骤二:构建数据集与训练模型 将数据转换为TFRecord格式,并进行ASR模型训练。
3.步骤三:评估并导出模型 模型训练完成后,需要对模型的精准度进行评测。如果对模型满意,则可以将训练好的模型导出为SavedModel,进行分布批量预测。
4.步骤四:模型预测 您可以使用导出的SavedModel模型进行预测。
EasyASR(语音智能增强算法包)提供多种模型的训练及预测功能,旨在帮助语音智能应用开发者方便快捷地构建语音模型并应用于生产。 在PAI-DSW中使用EasyASR算法包。 前提条件 已创建PAI-DSW实例,且该实例满足版本限制,建议使用GPU版本的PAI-DSW实例。 背景信息, 采用wav2letter-small模型作为预训练模型,除此之外,PAI还提供了wav2letter-base、transformer-small及transfromer-base三个预训练的ASR模型,供您使用。您只需要下载对应的文件,并使用其替换操作流程中的相应输入即可。 使用限制 EasyASR仅支持如下Python版本和TensorFlow版本: 仅支持Python 3.6版本。 支持TensorFlow 1.12或PAI-TensorFlow 1.15版本。 不支持所有的PyTorch版本。 建议采用PAI-DSW的镜像tensorflow:1.12PAI-gpu-py36-cu101-ubuntu18.04或tensorflow:1.15-gpu-py36-cu100-ubuntu18.04。 操作流程 在PAI-DSW中使用EasyASR进行语音识别的流程如下: 步骤一:准备数据 下载语音识别的训练数据。
步骤二:构建数据集与训练模型 将数据转换为TFRecord格式,并进行ASR模型训练。
步骤三:评估并导出模型 模型训练完成后,需要对模型的精准度进行评测。如果对模型满意,则可以将训练好的模型导出为SavedModel,进行分布批量预测。
步骤四:模型预测 您可以使用导出的SavedModel模型进行预测。
我总结了一下给你,希望对你有帮助! PAI-DSW中使用EasyASR进行语音识别流程大致如下:
1.首先,使用EasyASR提供的语音识别模型,将语音输入转换为文本;
2.然后,使用PAI-DSW提供的文本分析模型,对文本进行分析;
3.最后,根据分析结果,进行相应的处理。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。