PAI AI行业插件OCR识别Quick Start

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 机器学习平台PAI(Platform of Artificial Intelligence)上AI行业插件提供视觉模型训练插件和通用模型训练插件,支持在线标注、自动模型训练、超参优化及模型评估。只需要准备少量标注数据,并设置训练时长,就可以得到深度优化的模型。同时,插件平台与PAI-EAS高效对接,可以一键完成模型部署。本文介绍使用视觉模型训练插件进行OCR(Optical Character Recognition)识别的详细流程,以供参考。

Step By Step

  • 1.创建oss bucket,上传测试数据文件:下载OCR Demo数据。
  • 2.创建实例,新建数据集:用于数据标注
  • 3.创建任务
  • 4.查看训练详情
  • 5.服务端部署模型
  • 6.控制台在线调试

一.创建oss bucket,上传测试数据

  • 为了便于测试,可以新建一个Bucket,之后将文本demo上传至新建Bucket中
  • :(1)数据集可以采用纯图片式的,需要手动标注。也可以采用符合数据集规范的带有标注结果的XML文件。本文采用纯图片式的数据集用于测试
      (2)OCR识别的图像需要满足数据集要求和规范,详见使用限制

lQLPJxadVGoeMJbNArPNBZGwTniPhu7h824DAtXaTYAnAA_1425_691.png


二.创建实例,新建数据集:用于数据标注

  • 1.创建实例

lQLPJxadU7504OPNAr3NB2ywcBCdvW59r6QDAtTA_0BCAA_1900_701.png


  • 2.新建数据集

lQLPJxadTv-2wEfNAsXNBqOwP2GN_BZzruEDAsz6jkAGAA_1699_709.png


  • 3.数据标注

lQLPJxad3x5kmWDNAzbNBiKwlx2D1cy3UhQDA7ka4YBvAA_1570_822.png


lQLPJxad4zgH3OjNA0PNBgiwwcybaVCLxNYDA7_SMEBaAA_1544_835.png

三.创建任务

lQLPJxadT_jcfh3NAubNB02wOcK5qGY-bt8DAs6S8UCEAA_1869_742.png


lQLPJxadUA7qPoHNAsTNBhuwt6Kn_n-pu6cDAs63EkB1AA_1563_708.png

四.查看训练详情

lQLPJxad54kZ0xfNAtvNBnSwC3nVWcUmrV8DA8blkwBvAA_1652_731.png


lQLPJxad58Lq2YfNA0fNBb6wy4BUMa1DQwcDA8dEQ8B1AA_1470_839.png

五.服务端部署模型

1661218999713_80AA33D2-51D2-4a8a-AC67-A37DAA9D8B37.png


1661219127405_205AED37-8FE1-4e32-8D4D-F3F6EA3F8864.png


六.控制台在线调试

  • 1.请求Body示例
{
  "dataArray":[
    {
      "name":"image",
      "type":"stream",
      "body":"base64数据"
    }
  ]
}

image.png

  • 3.在线调试

lQLPJxad3bZhf83NAr7NBf6w0HO95k9nE7UDA7bMswBuAA_1534_702.png


1661218935352_D60AC39D-7CC3-4be8-BFCA-7FEEDB2CBC4A.png

更多参考

OCR识别
PAI-AutoLearning 图像分类使用教程

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
目录
相关文章
|
28天前
|
文字识别 前端开发 API
文字识别OCR常见问题之处理产品图片识别如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
22 3
|
28天前
|
文字识别
文字识别OCR常见问题之拦截扫描件的识别如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
20 2
|
28天前
|
文字识别 API 开发工具
文字识别OCR常见问题之买了资源包识别不成功扣次数如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
22 3
|
1月前
|
编解码 文字识别 测试技术
3000 字带你了解Claude3 视觉能力,OCR, 菜单识别统统能搞定!
五大任务,带你了解Claude3的视觉能力有多强 2024 年 3 月 4 日,Anthropic 震撼发布了全新的多模态模型——Claude 3。据该公司介绍,无论是语言处理还是视觉识别任务,Claude 3 都展现出了超越同类竞争产品(例如配备视觉功能的 GPT-4)的卓越性能。
97 0
|
28天前
|
文字识别 API
文字识别OCR常见问题之支持香港和澳门的营业执照识别如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
22 3
|
28天前
|
存储 文字识别 API
文字识别OCR常见问题之识别一些截图的模式如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
26 0
文字识别OCR常见问题之识别一些截图的模式如何解决
|
28天前
|
文字识别 负载均衡 安全
文字识别OCR常见问题之通用识别和手写体识别直接合并调用如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
32 4
|
28天前
|
文字识别
文字识别OCR常见问题之图片识别不出来如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
18 2
|
28天前
|
文字识别 开发工具
文字识别OCR常见问题之行驶证识别最近总是识别错误如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
30 0
|
2月前
|
文字识别 安全 API
阿里云文字识别OCR的发票凭证识别功能可以通过API接口的形式进行调用
【2月更文挑战第5天】阿里云文字识别OCR的发票凭证识别功能可以通过API接口的形式进行调用
79 5

热门文章

最新文章