PAI AI行业插件OCR识别Quick Start

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 机器学习平台PAI(Platform of Artificial Intelligence)上AI行业插件提供视觉模型训练插件和通用模型训练插件,支持在线标注、自动模型训练、超参优化及模型评估。只需要准备少量标注数据,并设置训练时长,就可以得到深度优化的模型。同时,插件平台与PAI-EAS高效对接,可以一键完成模型部署。本文介绍使用视觉模型训练插件进行OCR(Optical Character Recognition)识别的详细流程,以供参考。

Step By Step

  • 1.创建oss bucket,上传测试数据文件:下载OCR Demo数据。
  • 2.创建实例,新建数据集:用于数据标注
  • 3.创建任务
  • 4.查看训练详情
  • 5.服务端部署模型
  • 6.控制台在线调试

一.创建oss bucket,上传测试数据

  • 为了便于测试,可以新建一个Bucket,之后将文本demo上传至新建Bucket中
  • :(1)数据集可以采用纯图片式的,需要手动标注。也可以采用符合数据集规范的带有标注结果的XML文件。本文采用纯图片式的数据集用于测试
      (2)OCR识别的图像需要满足数据集要求和规范,详见使用限制

lQLPJxadVGoeMJbNArPNBZGwTniPhu7h824DAtXaTYAnAA_1425_691.png


二.创建实例,新建数据集:用于数据标注

  • 1.创建实例

lQLPJxadU7504OPNAr3NB2ywcBCdvW59r6QDAtTA_0BCAA_1900_701.png


  • 2.新建数据集

lQLPJxadTv-2wEfNAsXNBqOwP2GN_BZzruEDAsz6jkAGAA_1699_709.png


  • 3.数据标注

lQLPJxad3x5kmWDNAzbNBiKwlx2D1cy3UhQDA7ka4YBvAA_1570_822.png


lQLPJxad4zgH3OjNA0PNBgiwwcybaVCLxNYDA7_SMEBaAA_1544_835.png

三.创建任务

lQLPJxadT_jcfh3NAubNB02wOcK5qGY-bt8DAs6S8UCEAA_1869_742.png


lQLPJxadUA7qPoHNAsTNBhuwt6Kn_n-pu6cDAs63EkB1AA_1563_708.png

四.查看训练详情

lQLPJxad54kZ0xfNAtvNBnSwC3nVWcUmrV8DA8blkwBvAA_1652_731.png


lQLPJxad58Lq2YfNA0fNBb6wy4BUMa1DQwcDA8dEQ8B1AA_1470_839.png

五.服务端部署模型

1661218999713_80AA33D2-51D2-4a8a-AC67-A37DAA9D8B37.png


1661219127405_205AED37-8FE1-4e32-8D4D-F3F6EA3F8864.png


六.控制台在线调试

  • 1.请求Body示例
{
  "dataArray":[
    {
      "name":"image",
      "type":"stream",
      "body":"base64数据"
    }
  ]
}

image.png

  • 3.在线调试

lQLPJxad3bZhf83NAr7NBf6w0HO95k9nE7UDA7bMswBuAA_1534_702.png


1661218935352_D60AC39D-7CC3-4be8-BFCA-7FEEDB2CBC4A.png

更多参考

OCR识别
PAI-AutoLearning 图像分类使用教程

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
目录
相关文章
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
【AI 生成式】如何利用生成式人工智能进行机器学习的数据增强?
【5月更文挑战第4天】【AI 生成式】如何利用生成式人工智能进行机器学习的数据增强?
|
6天前
|
机器学习/深度学习 人工智能 算法
【AI 初识】讨论深度学习和机器学习之间的区别
【5月更文挑战第3天】【AI 初识】讨论深度学习和机器学习之间的区别
|
6天前
|
机器学习/深度学习 数据采集 人工智能
【AI 初识】机器学习中维度的诅咒是什么?
【5月更文挑战第2天】【AI 初识】机器学习中维度的诅咒是什么?
|
6天前
|
机器学习/深度学习 人工智能 算法
【Python 机器学习专栏】强化学习在游戏 AI 中的实践
【4月更文挑战第30天】强化学习在游戏AI中展现巨大潜力,通过与环境交互和奖励信号学习最优策略。适应性强,能自主探索,挖掘出惊人策略。应用包括策略、动作和竞速游戏,如AlphaGo。Python是实现强化学习的常用工具。尽管面临训练时间长和环境复杂性等挑战,但未来强化学习将与其他技术融合,推动游戏AI发展,创造更智能的游戏体验。
|
6天前
|
人工智能 自然语言处理 IDE
如何让阿里云AI001号员工帮我写代码(含IDEA插件使用)
AI 智能时代,将改变所有人的思维方式,学习方式,更注重人的创造力和思考力,如果你懒,你将会被 AI 替代,如果你只想干简单不用动脑的活,你将会被 AI 替代,如果你只会打螺丝,更会被 AI 替代。当下的 AI 人工智能时代,被认为是第四次工业革命的到来,我们更应该看到的是机会,而非跳进焦虑、困惑、悲观的一群人潮中。
|
6天前
|
机器学习/深度学习 人工智能 算法
【机器学习】探究Q-Learning通过学习最优策略来解决AI序列决策问题
【机器学习】探究Q-Learning通过学习最优策略来解决AI序列决策问题
|
6天前
|
机器学习/深度学习 人工智能 供应链
【专栏】阿里云RPA的Rap程序是自动化流程脚本,基于AI和机器学习,实现业务流程自动化
【4月更文挑战第29天】阿里云RPA的Rap程序是自动化流程脚本,基于AI和机器学习,实现业务流程自动化。具有灵活性、易用性、高效稳定和智能学习等特点。广泛应用于财务、人力资源、客服和供应链等领域,未来将与AI深度融合,跨平台应用,行业定制化,并构建完善生态,助力企业效率提升和创新。
|
6天前
|
数据采集 安全 测试技术
【专栏】阿里云RPA浏览器自动化插件是一款基于AI的创新工具
【4月更文挑战第29天】阿里云RPA浏览器自动化插件是一款基于AI的创新工具,能模拟浏览器操作,实现自动化业务流程,提升效率,降低成本。其特点包括强大的自动化能力、智能识别处理、灵活定制、稳定性能及安全保障。适用于数据采集、表单填写、网页测试、办公自动化和电商运营等场景,助力企业数字化转型。
|
6天前
|
机器学习/深度学习 人工智能 测试技术
自动化测试中AI与机器学习的融合应用
【4月更文挑战第29天】 随着技术的不断进步,人工智能(AI)和机器学习(ML)在软件测试中的应用越来越广泛。本文将探讨AI和ML如何改变自动化测试领域,提高测试效率和质量。我们将讨论AI和ML的基本概念,以及它们如何应用于自动化测试,包括智能测试用例生成,缺陷预测,测试执行优化等方面。最后,我们还将讨论AI和ML在自动化测试中的挑战和未来发展趋势。
|
6天前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI 操作报错合集之在PAI-DSW(平台上的AI数据科学工作站)上尝试修改实例名时,收到"实例不存在"的错误信息如何解决
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。

热门文章

最新文章