PAI AI行业插件OCR识别Quick Start-阿里云开发者社区

PAI AI行业插件OCR识别Quick Start

2022-08-24 430

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

模型训练 PAI-DLC，5000CU*H 3个月

个人证照识别，个人证照识别 200次/月

简介： 机器学习平台PAI（Platform of Artificial Intelligence）上AI行业插件提供视觉模型训练插件和通用模型训练插件，支持在线标注、自动模型训练、超参优化及模型评估。只需要准备少量标注数据，并设置训练时长，就可以得到深度优化的模型。同时，插件平台与PAI-EAS高效对接，可以一键完成模型部署。本文介绍使用视觉模型训练插件进行OCR（Optical Character Recognition）识别的详细流程，以供参考。

Step By Step

1.创建oss bucket，上传测试数据文件：下载OCR Demo数据。
2.创建实例，新建数据集：用于数据标注
3.创建任务
4.查看训练详情
5.服务端部署模型
6.控制台在线调试

一.创建oss bucket，上传测试数据

为了便于测试，可以新建一个Bucket，之后将文本demo上传至新建Bucket中
注：（1）数据集可以采用纯图片式的，需要手动标注。也可以采用符合数据集规范的带有标注结果的XML文件。本文采用纯图片式的数据集用于测试
（2）OCR识别的图像需要满足数据集要求和规范，详见使用限制

lQLPJxadVGoeMJbNArPNBZGwTniPhu7h824DAtXaTYAnAA_1425_691.png

二.创建实例，新建数据集：用于数据标注

1.创建实例

lQLPJxadU7504OPNAr3NB2ywcBCdvW59r6QDAtTA_0BCAA_1900_701.png

2.新建数据集

lQLPJxadTv-2wEfNAsXNBqOwP2GN_BZzruEDAsz6jkAGAA_1699_709.png

3.数据标注

lQLPJxad3x5kmWDNAzbNBiKwlx2D1cy3UhQDA7ka4YBvAA_1570_822.png

lQLPJxad4zgH3OjNA0PNBgiwwcybaVCLxNYDA7_SMEBaAA_1544_835.png

三.创建任务

lQLPJxadT_jcfh3NAubNB02wOcK5qGY-bt8DAs6S8UCEAA_1869_742.png

lQLPJxadUA7qPoHNAsTNBhuwt6Kn_n-pu6cDAs63EkB1AA_1563_708.png

四.查看训练详情

lQLPJxad54kZ0xfNAtvNBnSwC3nVWcUmrV8DA8blkwBvAA_1652_731.png

lQLPJxad58Lq2YfNA0fNBb6wy4BUMa1DQwcDA8dEQ8B1AA_1470_839.png

五.服务端部署模型

六.控制台在线调试

1.请求Body示例

{
  "dataArray":[
    {
      "name":"image",
      "type":"stream",
      "body":"base64数据"
    }
  ]
}

2.本地图片base64编码处理

3.在线调试

lQLPJxad3bZhf83NAr7NBf6w0HO95k9nE7UDA7bMswBuAA_1534_702.png

PAI AI行业插件OCR识别Quick Start