本文介绍了阿里云提供的四种DeepSeek部署方案,包括基于百炼调用满血版API、基于函数计算部署、基于人工智能平台PAI部署和GPU云服务器部署。通过这些方案,用户可以摆脱“服务器繁忙”的困扰,实现快速部署与使用。通过本文的部署体验及评测,可以帮助你更好的选择部署方案。
本文已同步至以下平台:
掘金:https://juejin.cn/post/7473339254145007670
CSDN:https://blog.csdn.net/weixin_46769087/article/details/145759446?spm=1001.2014.3001.5501
👉 1.背景简介
大家好,我是石小石!在AI技术飞速发展的今天,🔥DeepSeek🔥作为国内领先的智能对话模型,凭借媲美GPT-4的多轮对话能力和强大的行业知识处理优势,迅速引发了各行各业的热烈关注。从普通用户到企业开发者,大家纷纷争相体验这个“最懂中文”的AI大脑。
然而,随着用户量的激增,服务器压力逐渐增大,频繁出现“服务器繁忙,请稍后再试”的提示,成为使用体验的最大瓶颈。
虽然网上有不少大牛分享本地部署的教程,但本地部署需要一定的编程基础,实施起来难度较大,且硬件成本较高,很多用户因此望而却步❌。
而今天,阿里云推出了一项“技术平权”的创新方案——无需编写代码、不需要高性能显卡、零元起步的极致部署体验,让每个用户都能在5分钟内快速启动完整版DeepSeek。这不仅是技术上的突破,更预示着AI普惠时代的真正到来。
官方部署解决方案链接:https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms?utm_content=g_1000401616
通过这篇文章,我将带领大家通过官方提供的解决方案,从零开始实现完整版DeepSeek的部署与本地使用,让每位用户都能轻松、顺畅地体验DeepSeek的强大功能。在部署结束,博主也会根据部署体验,进行评测,帮助大家更快、更准确的的选择合适的部署方案。
🎯 2.部署方案概述
为了满足不同用户群体的需求,阿里云提供了四种灵活多样、涵盖了从简单快速体验到高度定制化的部署方案:
满血版DeepSeek部署:
1️⃣ 基于百炼调用满血版 API
蒸馏版模型部署:
2️⃣ 基于人工智能平台 PAI 部署
3️⃣ 基于函数计算部署
4️⃣ 基于GPU 云服务器部署
对于新手或希望快速体验DeepSeek的用户,方案1是最简单且最合适的选择。通过阿里云的百炼平台,我们可以直接使用标准化的API接口,无需自行搭建模型服务基础设施。你不仅可以在百炼平台上直接调用DeepSeek模型,还可以搭配Chatbox可视化客户端,在本地进行使用。如果你是开发者,还可以利用百炼API自行搭建个性化服务,满足更灵活的需求。
对于具备一定技术基础或有定制化需求的用户,可以选择方案2、3或4。基于人工智能平台PAI的部署方案适合需要模型微调的场景,尤其是在业务应用中需要定制化的用户。基于函数计算的部署方案适合注重按需付费且不希望处理运维工作的开发者,它能够提供灵活的计算资源并减少运维负担。对于有深度学习训练需求或对推理性能有较高要求的企业用户,GPU云服务器部署则是最佳选择,它能够提供强大的计算能力,适合大规模数据处理和高并发场景。更多详细信息,请继续阅读下文的部署方案。
你可能对阿里云的百炼平台还不了解。没关系,下文会继续解释。
⭐ 3.DeepSeek部署与使用
⚠️注意,在开始部署前,如果您还没有阿里云账号,请访问阿里云账号注册页面,根据页面提示完成注册。
🔥 3.1.满血版DeepSeek部署
本方案核心是通过阿里云的百炼模型服务进行 DeepSeek 开源模型调用。首次使用阿里云百炼服务,我们需要登录阿里云百炼大模型服务平台,根据下图提示进行开通。
如果顶部显示如下消息,您需要开通百炼的模型服务,以获得免费额度。
阿里云百炼模型平台是阿里云提供的一站式机器学习平台,它集成了从数据处理、模型训练到模型部署的全流程服务。它能帮助企业和开发者更高效地构建和应用人工智能解决方案。在本次部署方案中,我们正是借助其百炼模型服务实现DeepSeek 模型的快速部署与体验。
当我们开通百炼服务后,会立即获得 100万的 免费 token,通过这些免费的token,我们便能通过百炼服务快速体验DeepSeek了。
当然,不同模型之间的费用也是不相同的,如果你感兴趣,可以查看大模型产品计费
3.1.1.直接体验DeepSeek(百炼平台)
百炼平台可以通过更换大语言模型,直接调用满血的DeepSeek 。
如上图,当我们更换好模型后,就可以愉快的使用DeepSeek了。
3.1.2本地使用DeepSeek(Chatbox)
如果你想在本地使用满血DeepSeek,这将是最佳方案。这种方案的核心是通过本地客户端Chatbox直接调用百炼服务,获取DeepSeek的回答。
要通过Chatbox调用DeepSeek,我们首先需要获取百炼 API-KEY,然后下载、配置Chatbox 客户端。
- 1️⃣ 获取百炼 API-KEY
登录阿里云百炼大模型服务平台,鼠标悬停于页面右上角的 图标上,在下拉菜单中单击API-KEY。参考下图,可以快速创建API-KEY。
- 2️⃣ Chatbox客户端的下载与配置
Chatbox 是一款 AI 客户端应用和智能助手,支持众多先进的 AI 模型和 API,我们从官网下载并安装该应用。
下载好后,按照下图方式操作进行配置
然后参考下表,完成Chatbox的API_KEY的配置
项目 |
说明 |
示例值 |
模型提供方 |
下拉选择模型提供方。 |
添加自定义提供方 |
名称 |
填写定义模型提供方名称。 |
自定义名称,随便输入 |
API 域名 |
填写模型服务调用地址。 |
|
API 路径 |
填写模型服务调用路径。 |
|
API 密钥 |
填写模型服务调用 API 密钥。 |
填写 上一步骤获取的百炼 API-KEY |
模型 |
填写调用的模型(本方案以 deepseek-r1 模型为例,可自行配置其它模型进行体验)。 |
|
填写完毕后,点击保存按钮
现在,我们就可以在本地愉快的使用满血版DeepSeek了。
3.1.3自定义调用DeepSeek(百炼API)
如果你是开发者,可以在模型广场找到 DeepSeek 的 API 调用示例,参考示例代码,你可以非常快速的搭建一个专属的 DeepSeek 问答网站。
作为一名前端开发者,我利用 Node 调用 API 接口,并使用 Vue 3 实现前端页面,在不到两个小时的时间里,就完成了 DeepSeek 私人版网站的开发。以下是网站demo效果图。
上述网站的实现过程非常简单,如果你感兴趣,可以参考我的教程博客,按步骤轻松实现。
node+websoket极速构建一个私有ChatGPT!AI套壳居然如此简单!
文中的代码可以直接复用,只需替换成百炼的 API_KEY、baseUrl 和 DeepSeek 模型即可。
🎉 3.2.蒸馏版模型部署
蒸馏版模型通过“蒸馏”技术,将一个大而复杂的模型(满血版模型)压缩为更小、更高效的版本,保留了大部分性能的同时,降低了计算资源需求。
对于具备一定技术基础、对资源和性能有高要求或需要定制化的用户,蒸馏版模型部署具有明显优势。
以下部署方式适合具备一定技术知识的用户,且部署过程可能产生费用,使用完后参考官方提示及时释放资源,避免产生额外费用。
3.2.1基于函数计算部署
函数计算(FC)部署是一种无需管理服务器、按需运行代码的服务。简单来说,函数计算就像是“租用”云端的计算能力:你不必担心底层硬件和服务器,平台会根据负载自动调整计算资源,确保服务的稳定性和高效性。任务完成后,资源会自动释放,避免浪费。
对于具备一定技术基础、注重按需付费且不想处理运维的用户,这是一种非常合适的部署方式。
函数计算(FC)部署原理可以理解如下:
借助云原生应用开发平台,用户可以部署 Ollama 和 Open WebUI 两个 FC计算 函数。Ollama 负责托管deepseek模型,Open WebUI则提供一个用户可以直接体验deepseek的个人网站。
- 用户访问Web应用:用户通过浏览器打开 Open WebUI 界面与AI模型互动。
- 调用AI模型:Web界面向云端请求模型服务,Ollama框架负责处理,使用经过蒸馏技术优化的 DeepSeek-R1 模型,既保持了高性能又降低了计算消耗。
- 读取存储数据:模型需要的数据和文件存储在云端的 NAS 文件存储系统中,供模型调用。
整个过程由云平台自动管理,用户无需关注硬件或运维问题,可以专注于应用开发。平台按使用量收费,帮助优化成本。
根据官方解决方案部署教程,大约 8-12分钟 即可完成部署体验(DeepSeek-R1 和 Open WebUI 部署较慢)。
部署完成后,点击 Open WebUI,打开右侧的访问网址,即可开始体验 DeepSeek。
如果默认模型表现不理想,你可以通过修改 Ollama 模型服务配置 来更换其他模型。同时,亦可使用 Chatbox 客户端 配置 Ollama API 进行对话(使用deepseek部署成功后公网的访问域名调用)。
若感兴趣,可以参考官方教程进行实现。
3.2.2基于人工智能平台 PAI 部署
人工智能平台 PAI 是阿里云提供的一站式AI开发平台,通过PAI,用户可以轻松部署、训练和管理AI模型,无需关心底层硬件和基础设施。对于需要 模型微调 的业务场景(如客服知识库定制)来说,基于PAI的部署方式更加适合。
这种方案的架构如下👉:
通俗来说,这个过程就像是你委托朋友(客户端服务)到一个智能服务中心(PAI平台),把问题(请求)交给工作人员(EAS推理实例),然后工作人员使用工具(模型)帮你解决问题,再将答案送回给你朋友(通过API接口),最后,你的朋友把结果告诉你。
官方的部署方案非常清晰简洁,按照指引,我们可以轻松完成部署(大约需要10-15分钟)。
部署完成后,参考官方的应用体验指南,使用获得的API密钥并选择合适的模型,就能在ChatBox中顺利体验DeepSeek。
⚠️注意: 该服务按时计费,体验结束后请及时清理资源,以避免不必要的费用。
3.2.3.GPU云服务器部署
GPU云服务器部署适合对 推理速度 和 计算能力 有高要求的企业用户,特别是需要处理大规模数据或高并发场景时,可以显著提高性能(借用官方GPU服务器)。相比其他方案,它提供了更多的灵活性和更强的处理能力,但需要具备一定的运维经验来配置和管理资源。
这种方案的技术架构如下:
由于需要使用GPU云服务器及部署应用,该解决方案的部署体验大约需要 30-45分钟,同时用户需要具备一定的运维知识。
整个部署过程分为 创建GPU实例、应用部署 和 应用体验 三个步骤。具体的部署流程可以参考官方解决方案部署教程,按照指引一步步进行操作。
应用部署完成后,我们可以在浏览器中访问 http://:8080 ,通过 Open WebUI 即可开始体验 DeepSeek。
(ECS公网IP是应用部署过程中记录的公网IP)
此外,我们还可以使用 Chatbox 客户端 配置 vLLM API 进行对话体验,具体过程参考官方文档。
🔍 4.部署解决方案体验评测
通过阿里云提供的四种DeepSeek部署方案,我亲身体验了每一种解决方案的部署过程,虽然花费了大量时间,但整体体验非常好。以下是我对这些方案的个人见解和体验总结,希望能帮助大家能更直观的感受官方解决方案的表现。
4.1.解决方案优势
作为一名接触阿里云不久的用户,我能够在短时间内仅依靠官方解决方案顺利完成部署,整个过程几乎没有遇到阻碍。这与官方提供的优秀解决方案密切相关。以下是我对该解决方案的几大优势总结:
- 多样化的部署选择:阿里云提供了四种不同的部署方式,涵盖了从快速体验到深度定制化的广泛需求。无论是对技术要求较低的用户,还是对定制化和高性能有较高要求的开发者,都能够找到最适合自己的方案。这种灵活性不仅让技术小白能够轻松上手,也满足了企业级用户对大规模、高效能应用的需求。
- 新颖的部署指引:与传统的部署文档相比,阿里云的解决方案指引采用了左右分屏的方式,左侧为详细步骤,右侧为实时操作面板。这种设计使得用户在学习和操作时更加直观清晰,特别是对于初学者来说,通过跟随操作能够减少操作难度,并加快部署进程。
- 详略得当,简洁直观:部署指引语言简洁明了,没有任何多余废话,也没有任何信息缺失,无论是初学者还是有一定经验的开发者,都能轻松跟随并完成部署。此外,官方在指引中提前提供了关于账号注册、服务开通等前置步骤的详细提示,有效避免了用户在操作过程中遇到的阻碍。
- 贴心的费用提示:考虑到部分部署方案可能产生费用,官方在教程的开始和结束都提供了明确的费用提示,并给出了相应的解决方案。在部署过程中,官方还特别关注成本控制。例如,在人工智能平台 PAI 部署方式中,用户需要根据需求选择不同价格的GPU资源。
官方指引推荐了最低成本的资源规格,帮助有效降低体验成本。
- 优质的客服服务:在部署过程中,难免会遇到一些疑问或无法解决的问题,但阿里云的客服服务非常给力。每当遇到问题,客服团队总能及时提供反馈并有效解决,极大地提升了用户体验。特别感谢高瑞漫同学,她不仅响应迅速,而且耐心细致,专业素养也非常高,给我带来了非常好的支持和帮助。
4.2.解决方案提升点
在部署体验过程中,我也发现一些解决方案的提升点。
- 部署方案对比不够突出
虽然阿里云提供了丰富的部署选项,但在解决方案的首页,四种部署方案的介绍并未做到足够突出。对于一新手小白或具备一定技术背景的用户,如何快速选择最适合自己的方案仍然是一个挑战。
为了提高用户体验,我认为可以在首页部分首先简要介绍这四种方案,清晰对比它们的不同特点、适用场景和目标用户群体,这样可以帮助用户更快速地选择最合适的部署方式。
- 解决方案交互优化
官方的左右分屏指引设计非常好,但对于使用双屏的用户来说,当前的操作方式存在一定的局限性。例如,教程中的一些链接只能在右侧面板内打开,无法直接在新标签页中打开,造成了双屏操作时的困扰。
为提升交互体验,建议加入“新标签页打开链接”的功能,使得双屏用户能更灵活地操作。
此外,也希望官方能进一步优化左右联动的交互体验。例如,在部署准备的页面,右侧的实操面板展示了很多与当前步骤无关的按钮,这可能会让用户感到困惑。
如果官方能够优化这一点,在不同步骤的页面中,右侧的实操面板仅展示与当前步骤相关的内容,将进一步提升用户体验
- 模型问题
在基于函数计算部署方式中,通过 Open WebUI 访问的 cap-deepseek-r1:latest 模型表现不佳,遇到一些问题时无法给出有效的回答,而且在回答一些专业技术问题时也存在较大偏差。例如,当我询问关于 Vue 3 的原理时,模型给出的回答与实际情况差距较大。
不过目前不确定是模型本身存在缺陷,还是部署过程出现了问题,希望官方能进一步优化这个模型,提升其对技术类问题的准确性和可靠性。
- 部署失败问题
在部署过程中,我遇到了一个无法解决的问题:第一次使用基于函数计算的部署方式后,我释放了资源。然而,在二次部署时,open-webui始终无法成功部署。
查看日志时,尽管有一些信息,但由于我自身专业知识有限,未能找到有效的解决方案。幸运的是,我发现了【云原生应用平台】的帮助文档,但在【常见问题】页面竟然是空白,难道没有其他人遇到类似的部署失败问题吗?
由于帮助文档未能提供有效的信息,我尝试了更换部署地区并切换函数计算版本(从2.0到3.0)。经过多次部署,耗费了数小时并产生了一定费用(具体可参考费用章节),但问题依旧没有得到解决。
希望官方能够在部署失败时,提供更详细的解决方案,以提升用户体验。
- 二次进入控制台提示不足
在部署体验过程中,用户很容易不小心关闭控制台,再次进入时,想找到之前的部署内容并不容易。尽管官方提供了一键恢复功能,但恢复的仅是页面视图,对于首次使用阿里云产品的新用户而言,定位和查找已部署的服务仍然较为困难。以基于人工智能平台PAI的部署为例,产生的API调用链接如果没有明确提示,用户要重新找到它会比较麻烦。
💰 5.关于费用
部署蒸馏版模型可能会产生费用,尤其是对于老用户或没有试用产品的用户。因此,各位小伙伴在体验后,请务必按照部署指引及时清理资源,避免产生不必要的费用。
例如,清理函数计算应用资源时,务必按照相关步骤操作。
此外,对官方的扣费方式,我觉得还可以更加人性化一些。
在二次部署函数计算服务体验DeepSeek时,由于一些未知原因,我多次尝试部署,结果Open-WebUI始终失败。
因为函数计算是按量付费的模式,我认为既然Open-WebUI部署失败,且我没有成功体验DeepSeek,也没有单独调用已部署成功的模型API,本次部署应该不会产生费用。因此,我没有及时清理资源便去休息了。然而,第二天查看账单时,我发现产生了费用,这让我感到非常沮丧。
于是,我联系了客服咨询费用问题。
客服表示模型部署成功了,所以会持续扣费。虽然从客服的角度来说,这样的处理并无问题,但从用户体验角度来看,我感到不合理。明明部署失败一部分,没有体验成功,还扣费近60的费用,好委屈。
如果可以的话,希望官方能够优化扣费机制,至少对体验用户的扣费能更加合理一些。
此外,我认为扣费提醒服务还可以进一步优化。在消费明细中,23点左右我已经产生了40多元的欠费,但欠费短信直到凌晨0:15才发送,且短信中仅告知欠费2元多,信息延迟过长。而且,即使第二天,我也没有收到关于具体欠费金额的提醒。
如果我没有及时登录账号查看,恐怕费用还会继续产生。因此,建议官方可以优化欠费提醒机制,或者增加相应功能,确保在欠费发生后能够立即停机,避免用户因为信息滞后而产生额外费用。
📝 6.总结
本文深入探讨了阿里云提供的四种DeepSeek部署方案:基于百炼调用满血版 API、基于函数计算部署、基于人工智能平台 PAI 部署 和 GPU 云服务器部署。这些方案不仅解决了用户在高峰期间面临的“服务器繁忙,请稍后再试”的困扰,还为不同技术水平和需求的用户提供了多样化的选择,极大地降低了AI技术的使用门槛,推动了人工智能的普惠化进程。此外,官方提供的解决方案清晰直观、简洁明了,对于新手用户来说非常友好。不过,部署方案仍有一些改进空间,尤其是在交互体验和费用提醒等方面,仍需要进一步优化。
6.1.方案对比
方案 |
难易程度 |
部署时长 |
成本 |
目标用户 |
使用场景 |
基于百炼调用满血版 API |
简单,无需编程 |
快速(约 5 分钟) |
免费额度内可体验,超出按量计费 |
想快速体验、技术要求不高的用户 |
快速体验AI模型,适合小规模应用、原型开发或初次接触AI的用户 |
基于函数计算部署 |
中等,需配置 API 调用 |
中等(约 8-12 分钟) |
按需付费,低成本 |
不想管理服务器的开发者,注重按需付费的用户 |
轻量级应用、API 服务、无需维护后台的快速部署,适合小型到中型应用场景 |
基于人工智能平台 PAI 部署 |
简单,图形化操作界面 |
快速(约 10-15 分钟) |
按使用量付费,费用可控 |
需要简便部署并可能进行模型微调的开发者 |
快速部署,适用于需要进行模型微调或在业务应用中进行快速交付的场景,如客服系统、智能问答等 |
GPU 云服务器部署 |
较复杂,需管理资源 |
较长(约 30-45 分钟) |
根据 GPU 配置计费,成本较高 |
具备运维能力,要求高性能推理的高级用户 |
高并发、大数据处理、推理速度要求高的场景,适用于科研、深度学习训练、大规模生产环境中的推理任务 |
6.2.如何选择合适的方案
据上文的部署方案对比,针对不同的用户需求和使用场景,以下是我个人的部署方案推荐建议👉:
- 技术小白或对AI技术感兴趣的用户:优先选择“基于百炼调用满血版 API”的方案。其无需编写代码、部署时间短,且有免费额度,适合快速入门体验。
- 创业团队或中小型企业:建议选择“基于函数计算部署”方案。此方案采用按需付费模式,无需管理服务器资源,能有效降低运营成本,特别适合资源有限且追求低成本解决方案的团队。
- 企业级用户或有模型微调需求的开发者:首选“基于人工智能平台 PAI 部署”方案。PAI平台支持从数据处理到模型训练的全流程服务,并且提供灵活的定制功能,适合需要微调和高效部署的企业应用。
- 科研机构、大型项目或对推理能力有极高要求的用户:选择“GPU云服务器部署”方案。该方案提供最强的计算能力和灵活的资源配置,适用于需要高并发、大规模数据处理或复杂模型推理的高性能场景。
6.3.展望
从“望而却步” 到 “触手可及”,阿里云提供的四种deepseek部署方式,重新定义了 AI 部署的新范式,极大地降低了门槛,让更多用户能够轻松拥抱这一变革性技术。
我相信,在不远的未来,AI技术不再是技术大佬的专利,它将成为每个人、每个企业日常工作中不可或缺的一部分。随着技术不断完善,AI的应用场景将越来越广泛,我们将更加贴近一个由AI驱动的未来,其中AI将为各行业带来深远影响,助力更高效、更智能的社会发展🚀。
加油各位!加油阿里云!