通过人工智能平台PAI部署DeepSeek-OCR模型 官网控制台部署

简介: 本方案介绍如何在阿里云PAI平台部署DeepSeek-OCR开源模型,涵盖从账号准备、模型部署到应用体验的完整流程。通过PAI的Model Gallery可一键部署,结合PAI-EAS实现高性能推理,支持公网调用。适用于OCR场景快速搭建与测试,体验后建议及时清理资源以避免计费。

方案概览
本方案旨在介绍如何通过人工智能平台 PAI部署DeepSeek-OCR 开源模型。人工智能平台 PAI 为 AI 研发提供了全链路支持,覆盖了从数据标注、模型开发、训练、评估、部署和运维管控的整个 AI 研发生命周期。其中,Model Gallery 组件提供了一个丰富多样的模型资源库,使用户能够轻松地查找、部署、训练和评估模型,大大简化了开发流程。目前 Model Gallery 已接入 DeepSeek-OCR。PAI-EAS 则提供了高性能的模型推理服务,支持多种异构计算资源,并配备了一套完整的运维和监控系统,确保服务的稳定性和高效性。

方案架构
按照本方案提供的配置完成部署后,会在阿里云上搭建一个如下图所示的运行环境。实际部署时,您可根据具体的资源规划调整部分配置,但最终的运行环境将与下图展示的架构相似。
image.png
本方案的技术架构包括以下云服务:

Model Gallery :人工智能平台 PAI 的一个组件,集成了众多 AI 领域高质量的预训练模型。

PAI-EAS :人工智能平台 PAI 的一个组件,针对在线推理场景提供的模型在线服务,采用基于按量付费的 GPU 公共资源组。

部署准备
开始部署前,请按以下指引完成账号申请、账号充值等准备工作。

准备账号
如果您还没有阿里云账号,请访问阿里云账号注册页面,根据页面提示完成注册。阿里云账号是您使用云资源的付费实体,因此是部署方案的必要前提。

为阿里云账号充值。本方案的云资源支持按量付费,且默认设置均采用按量付费引导操作。如果确定任何一个云资源采用按量付费方式部署,账户余额都必须大于等于100元。

部署 DeepSeek-OCR 模型

1.登录PAI 控制台,首次登录需要开通服务。请注意左上角选择需开通的地域。推荐华北6(乌兰察布),有较多可用资源提供。
image.png
2.开通成功后,点击进入控制台按钮。
image.png
3.在工作空间页面的左侧导航栏选择 Model Gallery 。
4.在搜索框中输入DeepSeek-OCR,点击卡片进入模型详情页,然后点击右上角部署按钮。
image.png
5.选择工作空间,点击确定。
6.在弹出的部署面板中,按照以下参数完成部署配置,其余参数保持默认,完成参数配置后单击部署,在计费提醒页面阅读计费信息后,单击确定,完成模型在线服务创建。
推理引擎:选择SGLang。
部署模板:选择单机。
基本信息:保持默认不变
部署资源:资源类型选择公共资源,资源规格选择ml.gu7i.c16m60.1-gu30。
说明
若当前区域中某规格的计算资源库存不足,您可以尝试选择资源规格列表中其他规格实例或在控制台左上角切换至其他区域如华北6(乌兰察布)寻找计算资源。
7.在人工智能平台PAI控制台左侧导航栏,单击Model Gallery > 任务管理,当服务部署完成后状态会切换为运行中。在部署任务列表页找到目标服务并单击服务名称,进入服务详情页。
image.png
8.单击查看调用信息,在弹出的面板中复制保存公网调用地址和 Token 。
image.png
应用体验
一、使用 Chatbox 客户端进行对话
访问 Chatbox 下载地址下载并安装客户端,本方案以 macOS M3 为例。
image.png
image.png
image.png
image.png
image.png
最终配置如下图所示,然后单击检查,等待提示连接成功后即代表模型提供方添加成功。
image.png
image.png
返回主界面点击新对话,并点击image图标针对OCR模型特性进行进一步设置。image.png
对话设置中删除所有系统提示,并关闭流式输出后点击保存。image.png
在文本输入框中可以输入图片并搭配提示词进行对话交互。此处以对收据图片进行OCR提取为例。image.png
清理资源

若不用于生产环境,建议在体验后按提示清理资源,避免继续产生费用。如因资源不足一直等待中,请注意停止模型服务,否则一旦资源充足会自动重试创建成功。

删除1个模型在线服务(EAS):

登录人工智能平台PAI控制台,在左侧导航栏选择模型部署 > 模型在线服务(EAS),在模型在线服务列表页面找到目标服务,在其右侧操作列,单击删除。
更多大模型可以在[体验中心里]面试用,免费领取tokens

相关文章
|
3月前
|
编解码 人工智能 文字识别
【Github热门项目】DeepSeek-OCR项目上线即突破7k+星!突破10倍无损压缩,重新定义文本-视觉信息处理
DeepSeek-OCR开源即获7k+星,首创“上下文光学压缩”技术,仅用100视觉token超越传统OCR模型256token性能,压缩比达10-20倍,精度仍超97%。30亿参数实现单卡日处理20万页,显著降低大模型长文本输入成本,重新定义高效文档理解新范式。
441 2
【Github热门项目】DeepSeek-OCR项目上线即突破7k+星!突破10倍无损压缩,重新定义文本-视觉信息处理
|
3月前
|
人工智能 运维 监控
从代码到生产推理服务:DevPod 全流程部署 DeepSeek-OCR 模型实战指南
DevPod重塑AI开发范式,实现从云端开发、调试到生产部署的全流程闭环。依托预置环境与GPU资源,一键完成模型服务化,打通AI落地“最后一公里”,让开发者专注业务创新。
|
9天前
|
数据采集 自然语言处理 监控
大模型应用:情感分析模型微调深度分析:从基础预测到性能优化.6
本文系统讲解中文情感分析模型微调后的深度评估方法,涵盖微调流程、预测置信度分析、混淆矩阵可视化、错误模式挖掘及系统性偏差诊断,强调超越准确率的可解释性分析,助力构建可靠、鲁棒的AI系统。
118 13
|
监控 安全 NoSQL
5 个适用于 Linux 的开源日志监控和管理工具
5 个适用于 Linux 的开源日志监控和管理工具
1108 0
|
4月前
|
人工智能 文字识别 并行计算
为什么别人用 DevPod 秒启 DeepSeek-OCR,你还在装环境?
DevPod 60秒极速启动,一键运行DeepSeek OCR大模型。告别环境配置难题,云端开箱即用,支持GPU加速、VSCode/Jupyter交互开发,重塑AI原生高效工作流。
820 35
|
2月前
|
人工智能 运维 负载均衡
AgentRun上线!5分钟完成企业级Agent构建
阿里云发布函数计算AgentRun,基于Serverless架构打造一站式Agentic AI基础设施,深度融合AI场景,实现毫秒级弹性、按需付费、安全沙箱与全链路可观测,助力企业降本60%,加速AI Agent高效落地生产环境。
489 0
AgentRun上线!5分钟完成企业级Agent构建
|
5月前
|
弹性计算 负载均衡 定位技术
阿里云服务器ECS【地域】如何选择?不同地域区别及优缺点对比
阿里云服务器地域选择需综合考虑用户地理位置、网络延迟、备案要求、内网互通、价格差异及产品功能等因素。建议根据用户所在地区就近选择地域,以降低延迟、提升访问速度。同时注意地域一旦选定不可更改,需谨慎选择。
1381 155
|
5月前
|
人工智能 自然语言处理 监控
Playwright MCP浏览器自动化全攻略
Playwright MCP让AI通过自然语言操控浏览器,无需编程即可实现网页自动化。支持智能元素识别、多浏览器操作与动态交互,广泛应用于搜索、数据抓取、自动发布等场景,大幅提升效率,降低技术门槛,是浏览器自动化的新范式。