开发者社区云服务技术课堂文章正文

阿里云机器学习平台PAI-AI行业插件-视觉模型平台OCR模型训练使用简明教程

2022-04-08 996

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： AI行业插件提供视觉模型训练插件和通用模型训练插件，他们支持在线标注、自动模型训练、超参优化及模型评估。您只需要准备少量标注数据，并设置训练时长，就可以得到深度优化的模型。同时，插件平台与PAI-EAS高效对接，可以快速将训练模型部署为RESTful服务。视觉模型训练插件支持视觉领域常用模型的标注、训练及发布，并针对移动端场景进行了模型深度优化，您可以通过手机扫码快速体验模型效果，也可以将模型进行服务端部署。本文着重讲述OCR文字识别使用简明教程

1、创建实例

2、数据准备

1.创建数据集

2.标注

3.创建任务

4.开始训练

5.训练完成

文章标签：

人工智能平台 PAI

文字识别

机器学习/深度学习

文字识别

人工智能

关键词：

阿里云AI

人工智能平台 PAI训练

阿里云人工智能平台 PAI

AI训练

AI ocr

相关实践学习

使用PAI+LLaMA Factory微调Qwen2-VL模型，搭建文旅领域知识问答机器人

使用PAI和LLaMA Factory框架，基于全参方法微调 Qwen2-VL模型，使其能够进行文旅领域知识问答，同时通过人工测试验证了微调的效果。

机器学习概览及常见算法

机器学习(Machine Learning, ML)是人工智能的核心，专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能，它是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。本课程将带你入门机器学习，掌握机器学习的概念和常用的算法。

浠博

阿里云大数据Al技术

机器学习/深度学习人工智能 JSON

【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

阿里云的人工智能平台 PAI，作为一站式的机器学习和深度学习平台，对DistilQwen2.5-R1模型系列提供了全面的技术支持。无论是开发者还是企业客户，都可以通过 PAI-ModelGallery 轻松实现 Qwen2.5 系列模型的训练、评测、压缩和快速部署。本文详细介绍在 PAI 平台使用 DistilQwen2.5-R1 蒸馏模型的全链路最佳实践。

阿里云大数据Al技术

697 63 63

游客ax4lbhl4lbuey

人工智能 Kubernetes API

Dify+DeepSeek实战教程！企业级 AI 文档库本地化部署，数据安全与智能检索我都要

接下来这篇文章，就打算用最接地气的方式，手把手带你从 0 到 1 搭建一套专属的本地知识库系统。无论你是想优化企业内部文档检索（不用担心敏感数据上传云端的风险），还是像我一样想为用户打造更智能的文档服务，都能跟着步骤一步步实现。咱们不卖关子，直接上干货

游客ax4lbhl4lbuey

4475 14 14

Dify+DeepSeek实战教程！企业级 AI 文档库本地化部署，数据安全与智能检索我都要

阿里云大数据Al技术

人工智能 JSON 算法

【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列，包括 DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。本文详细介绍DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践。

阿里云大数据Al技术

624 7 8

蚝油菜花

人工智能文字识别异构计算

SmolDocling：256M多模态小模型秒转文档！开源OCR效率提升10倍

SmolDocling 是一款轻量级的多模态文档处理模型，能够将图像文档高效转换为结构化文本，支持文本、公式、图表等多种元素识别，适用于学术论文、技术报告等多类型文档。

蚝油菜花

1308 1 1

martinzh717

机器学习/深度学习人工智能供应链

从概念到商业价值：AI、机器学习与深度学习全景指南

在这个科技飞速发展的时代🚀，人工智能正以惊人的速度渗透到我们的生活和工作中👀。但面对铺天盖地的AI术语和概念，很多人感到困惑不已😣。"AI"、"机器学习"、"深度学习"和"神经网络"到底有什么区别？它们如何相互关联？如何利用这些技术提升工作效率和创造价值？

martinzh717

707 0 0

阿里云开发者

12月前

机器学习/深度学习人工智能监控

AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程

本系列文章深入讲解了从Seq2Seq、RNN到Transformer，再到GPT模型的关键技术原理与实现细节，帮助读者全面掌握Transformer及其在NLP中的应用。同时，通过一个房价预测的完整案例，介绍了算法工程师如何利用数据训练模型并解决实际问题，涵盖需求分析、数据收集、模型训练与部署等全流程。文章适合初学者和开发者学习AI基础与实战技能。

阿里云开发者

1399 25 30

Deephub

人工智能安全 Shell

Jupyter MCP服务器部署实战：AI模型与Python环境无缝集成教程

Jupyter MCP服务器基于模型上下文协议（MCP），实现大型语言模型与Jupyter环境的无缝集成。它通过标准化接口，让AI模型安全访问和操作Jupyter核心组件，如内核、文件系统和终端。本文深入解析其技术架构、功能特性及部署方法。MCP服务器解决了传统AI模型缺乏实时上下文感知的问题，支持代码执行、变量状态获取、文件管理等功能，提升编程效率。同时，严格的权限控制确保了安全性。作为智能化交互工具，Jupyter MCP为动态计算环境与AI模型之间搭建了高效桥梁。

Deephub

857 2 2

游客jnstwksgqnrgi

机器学习/深度学习 PyTorch API

昇腾AI4S图机器学习：DGL消息传递接口的PyG替换

DGL (Deep Graph Learning) 和 PyG (Pytorch Geometric) 是两个主流的图神经网络库，它们在API设计和底层实现上有一定差异，在不同场景下，研究人员会使用不同的依赖库，昇腾NPU对PyG图机器学习库的支持亲和度更高，因此有些时候需要做DGL接口的PyG替换。

游客jnstwksgqnrgi

448 6 6

青云交（Java大数据AI云原生Python）

11月前

机器学习/深度学习自然语言处理算法

Java 大视界 -- Java 大数据机器学习模型在自然语言处理中的对抗训练与鲁棒性提升（205）

本文探讨Java大数据与机器学习在自然语言处理中的对抗训练与鲁棒性提升，分析对抗攻击原理，结合Java技术构建对抗样本、优化训练策略，并通过智能客服等案例展示实际应用效果。

青云交（Java大数据AI云原生Python）

331 0 0

游客jnstwksgqnrgi

机器学习/深度学习 PyTorch API

昇腾AI4S图机器学习：DGL图构建接口的PyG替换

本文探讨了在图神经网络中将DGL接口替换为PyG实现的方法，重点以RFdiffusion蛋白质设计模型中的SE3Transformer为例。SE3Transformer通过SE(3)等变性提取三维几何特征，其图构建部分依赖DGL接口。文章详细介绍了两个关键函数的替换：`make_full_graph` 和 `make_topk_graph`。前者构建完全连接图，后者生成k近邻图。通过PyG的高效实现（如`knn_graph`），我们简化了图结构创建过程，并调整边特征处理逻辑以兼容不同框架，从而更好地支持昇腾NPU等硬件环境。此方法为跨库迁移提供了实用参考。

游客jnstwksgqnrgi

503 3 3

阿里云机器学习平台PAI-AI行业插件-视觉模型平台OCR模型训练使用简明教程

1、创建实例

2、数据准备

1.创建数据集

2.标注

3.创建任务

4.开始训练

5.训练完成

云服务技术课堂

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

阿里云机器学习平台PAI-AI行业插件-视觉模型平台OCR模型训练使用简明教程

1、创建实例

2、数据准备

1.创建数据集

2.标注

3.创建任务

4.开始训练

5.训练完成

云服务技术课堂

热门文章

最新文章

相关课程

相关电子书

相关实验场景