通过人工智能平台PAI部署DeepSeek-OCR模型 官网控制台部署

简介: 本方案介绍如何在阿里云PAI平台部署DeepSeek-OCR开源模型,涵盖从账号准备、模型部署到应用体验的完整流程。通过PAI的Model Gallery可一键部署,结合PAI-EAS实现高性能推理,支持公网调用。适用于OCR场景快速搭建与测试,体验后建议及时清理资源以避免计费。

方案概览
本方案旨在介绍如何通过人工智能平台 PAI部署DeepSeek-OCR 开源模型。人工智能平台 PAI 为 AI 研发提供了全链路支持,覆盖了从数据标注、模型开发、训练、评估、部署和运维管控的整个 AI 研发生命周期。其中,Model Gallery 组件提供了一个丰富多样的模型资源库,使用户能够轻松地查找、部署、训练和评估模型,大大简化了开发流程。目前 Model Gallery 已接入 DeepSeek-OCR。PAI-EAS 则提供了高性能的模型推理服务,支持多种异构计算资源,并配备了一套完整的运维和监控系统,确保服务的稳定性和高效性。

方案架构
按照本方案提供的配置完成部署后,会在阿里云上搭建一个如下图所示的运行环境。实际部署时,您可根据具体的资源规划调整部分配置,但最终的运行环境将与下图展示的架构相似。
image.png
本方案的技术架构包括以下云服务:

Model Gallery :人工智能平台 PAI 的一个组件,集成了众多 AI 领域高质量的预训练模型。

PAI-EAS :人工智能平台 PAI 的一个组件,针对在线推理场景提供的模型在线服务,采用基于按量付费的 GPU 公共资源组。

部署准备
开始部署前,请按以下指引完成账号申请、账号充值等准备工作。

准备账号
如果您还没有阿里云账号,请访问阿里云账号注册页面,根据页面提示完成注册。阿里云账号是您使用云资源的付费实体,因此是部署方案的必要前提。

为阿里云账号充值。本方案的云资源支持按量付费,且默认设置均采用按量付费引导操作。如果确定任何一个云资源采用按量付费方式部署,账户余额都必须大于等于100元。

部署 DeepSeek-OCR 模型

1.登录PAI 控制台,首次登录需要开通服务。请注意左上角选择需开通的地域。推荐华北6(乌兰察布),有较多可用资源提供。
image.png
2.开通成功后,点击进入控制台按钮。
image.png
3.在工作空间页面的左侧导航栏选择 Model Gallery 。
4.在搜索框中输入DeepSeek-OCR,点击卡片进入模型详情页,然后点击右上角部署按钮。
image.png
5.选择工作空间,点击确定。
6.在弹出的部署面板中,按照以下参数完成部署配置,其余参数保持默认,完成参数配置后单击部署,在计费提醒页面阅读计费信息后,单击确定,完成模型在线服务创建。
推理引擎:选择SGLang。
部署模板:选择单机。
基本信息:保持默认不变
部署资源:资源类型选择公共资源,资源规格选择ml.gu7i.c16m60.1-gu30。
说明
若当前区域中某规格的计算资源库存不足,您可以尝试选择资源规格列表中其他规格实例或在控制台左上角切换至其他区域如华北6(乌兰察布)寻找计算资源。
7.在人工智能平台PAI控制台左侧导航栏,单击Model Gallery > 任务管理,当服务部署完成后状态会切换为运行中。在部署任务列表页找到目标服务并单击服务名称,进入服务详情页。
image.png
8.单击查看调用信息,在弹出的面板中复制保存公网调用地址和 Token 。
image.png
应用体验
一、使用 Chatbox 客户端进行对话
访问 Chatbox 下载地址下载并安装客户端,本方案以 macOS M3 为例。
image.png
image.png
image.png
image.png
image.png
最终配置如下图所示,然后单击检查,等待提示连接成功后即代表模型提供方添加成功。
image.png
image.png
返回主界面点击新对话,并点击image图标针对OCR模型特性进行进一步设置。image.png
对话设置中删除所有系统提示,并关闭流式输出后点击保存。image.png
在文本输入框中可以输入图片并搭配提示词进行对话交互。此处以对收据图片进行OCR提取为例。image.png
清理资源

若不用于生产环境,建议在体验后按提示清理资源,避免继续产生费用。如因资源不足一直等待中,请注意停止模型服务,否则一旦资源充足会自动重试创建成功。

删除1个模型在线服务(EAS):

登录人工智能平台PAI控制台,在左侧导航栏选择模型部署 > 模型在线服务(EAS),在模型在线服务列表页面找到目标服务,在其右侧操作列,单击删除。
更多大模型可以在[体验中心里]面试用,免费领取tokens

相关文章
|
6月前
|
人工智能 运维 监控
从代码到生产推理服务:DevPod 全流程部署 DeepSeek-OCR 模型实战指南
DevPod重塑AI开发范式,实现从云端开发、调试到生产部署的全流程闭环。依托预置环境与GPU资源,一键完成模型服务化,打通AI落地“最后一公里”,让开发者专注业务创新。
|
6月前
|
编解码 人工智能 文字识别
【Github热门项目】DeepSeek-OCR项目上线即突破7k+星!突破10倍无损压缩,重新定义文本-视觉信息处理
DeepSeek-OCR开源即获7k+星,首创“上下文光学压缩”技术,仅用100视觉token超越传统OCR模型256token性能,压缩比达10-20倍,精度仍超97%。30亿参数实现单卡日处理20万页,显著降低大模型长文本输入成本,重新定义高效文档理解新范式。
581 2
【Github热门项目】DeepSeek-OCR项目上线即突破7k+星!突破10倍无损压缩,重新定义文本-视觉信息处理
|
7月前
|
人工智能 文字识别 并行计算
为什么别人用 DevPod 秒启 DeepSeek-OCR,你还在装环境?
DevPod 60秒极速启动,一键运行DeepSeek OCR大模型。告别环境配置难题,云端开箱即用,支持GPU加速、VSCode/Jupyter交互开发,重塑AI原生高效工作流。
926 35
|
7月前
|
人工智能 物联网 调度
边缘大型AI模型:协作部署与物联网应用——论文阅读
论文《边缘大型AI模型:协作部署与物联网应用》系统探讨了将大模型(LAM)部署于边缘网络以赋能物联网的前沿框架。针对传统云端部署高延迟、隐私差的问题,提出“边缘LAM”新范式,通过联邦微调、专家混合与思维链推理等技术,实现低延迟、高隐私的分布式智能。
1209 6
边缘大型AI模型:协作部署与物联网应用——论文阅读
|
6月前
|
机器学习/深度学习 人工智能 前端开发
终端里的 AI 编程助手:OpenCode 使用指南
OpenCode 是开源的终端 AI 编码助手,支持 Claude、GPT-4 等模型,可在命令行完成代码编写、Bug 修复、项目重构。提供原生终端界面和上下文感知能力,适合全栈开发者和终端用户使用。
51634 11
|
存储 人工智能 API
AgentScope:阿里开源多智能体低代码开发平台,支持一键导出源码、多种模型API和本地模型部署
AgentScope是阿里巴巴集团开源的多智能体开发平台,旨在帮助开发者轻松构建和部署多智能体应用。该平台提供分布式支持,内置多种模型API和本地模型部署选项,支持多模态数据处理。
12594 78
AgentScope:阿里开源多智能体低代码开发平台,支持一键导出源码、多种模型API和本地模型部署
|
机器学习/深度学习 人工智能 开发者
DeepSeek安装部署指南,基于阿里云PAI零代码,小白也能轻松搞定!
阿里云PAI平台支持零代码一键部署DeepSeek-V3和DeepSeek-R1大模型,用户可轻松实现从训练到部署再到推理的全流程。通过PAI Model Gallery,开发者只需简单几步即可完成模型部署,享受高效便捷的AI开发体验。具体步骤包括:开通PAI服务、进入控制台选择模型、一键部署并获取调用信息。整个过程简单快捷,极大降低了使用门槛。
2286 43
|
存储 Prometheus 运维
【云故事探索】NO.8:揭秘餐饮行业龙头 SaaS 厂商神州商龙的全栈可观测实践
天津市神州商龙科技股份有限公司成立于1998年,专为餐饮行业提供数字化解决方案。公司服务10万余家知名餐饮企业,确保用餐体验的稳定性至关重要。在业务容器化和微服务化过程中,神州商龙面临技术架构多样性、高可用要求及成本控制等挑战。通过尝试自建Prometheus和SkyWalking监控方案,最终选择阿里云Prometheus和日志服务SLS,实现了统一可观测平台,提升了监控效率、缩短故障排查时间、增强系统稳定性和优化资源利用率。未来,神州商龙计划引入机器学习和AI技术,提升自动化运维水平,并进一步整合业务系统监控数据。
|
并行计算 数据可视化 数据处理
面向未来的数据科学工具链:Dask与Jupyter生态系统的融合
【8月更文第29天】随着数据量的不断增长,传统的数据处理方法已经难以满足科研和商业的需求。Dask 是一个并行计算库,能够有效地处理大规模数据集,同时它与 Jupyter Notebook 和其他数据科学工具的无缝集成,使得数据科学家能够构建更加高效的工作流程。本文将探讨如何利用 Dask 与 Jupyter 生态系统构建现代化的数据科学工作流,并通过具体的代码示例展示其实现过程。
363 1

热门文章

最新文章