0代码:一键部署DeepSeek系列模型,基于函数计算FC的Function AI模板安装部署,DeepSeek凭借其卓越的性能和广泛的应用场景,迅速在全球范围内获得了极高的关注度和广泛的用户基础。DeepSeek-R1-Distill是使用DeepSeek-R1生成的样本对开源模型进行蒸馏得到的小模型,拥有更小参数规模,推理成本更低,基准测试同样表现出色。Function AI提供模型服务、应用模板两种部署方式辅助您部署DeepSeek R1系列模型。完成模型部署后,您可以与模型进行对话体验,或以API形式进行调用,接入AI应用中。本文阿小云分享的是官网模型服务部署DeepSeek的教程,本文涉及云产品为函数计算FC:https://www.aliyun.com/product/fc 如下图:
支持的模型列表
部署方式说明:
Ollama:轻量级推理框架,专注于量化模型部署及各种开源LLM部署。
Transformer:由Hugging Face提供的模型推理框架,支持 PyTorch、TensorFlow 等主流深度学习框架的模型部署。
模型 |
部署方式 |
最低配置 |
DeepSeek-R1-Distill-Qwen-1.5B |
Transformer |
Tesla 16GB |
DeepSeek-R1-Distill-Qwen-7B |
Transformer |
Tesla 16GB |
DeepSeek-R1-Distill-Llama-8B |
Transformer |
Tesla 16GB |
DeepSeek-R1-Distill-Qwen-14B |
Transformer |
Ada 48GB |
DeepSeek-R1-Distill-Qwen-32B |
Transformer |
Ada 48GB |
DeepSeek-R1-Distill-Qwen-1.5B-GGUF |
Ollama |
Tesla 8GB |
DeepSeek-R1-Distill-Qwen-7B-GGUF |
Ollama |
Tesla 16GB |
DeepSeek-R1-Distill-Llama-8B-GGUF |
Ollama |
Tesla 16GB |
DeepSeek-R1-Distill-Qwen-14B-GGUF |
Ollama |
Ada 48GB |
DeepSeek-R1-Distill-Qwen-32B-GGUF |
Ollama |
Ada 48GB |
前置准备
本教程所涉及的模型服务其本质是在函数计算中创建的GPU函数,函数运行使用的资源按照函数规格乘以执行时长进行计量,如果无请求调用,则只收取浅休眠(原闲置)预留模式下预置的快照费用,Function AI中的极速模式等同于函数计算的浅休眠(原闲置)预留模式。建议您领取函数计算的试用额度抵扣资源消耗,超出试用额度的部分将自动转为按量计费,更多计费详情,请参见计费概述。
部署说明
本文通过应用模板和模型服务两种方式部署DeepSeeK服务,这两种方式支持的模型列表的是相同的,您可以通过以下任一方式部署DeepSeek蒸馏模型至函数计算。
- 方式一:应用模板部署:基于
Function AI的模板进行一键部署,部署方式简单快捷。但是由于基于模板进行部署,初次部署使用模板默认提供的DeepSeek-R1-Distill-Qwen-7B模型,导致无法自选模型。部署完成后,可在基础配置中更改模型。 - 方式二:模型服务部署:在部署的时候可以灵活选择模型,但是操作步骤相对较多,使用API形式进行模型调用,接入线上业务应用。
本文阿小云介绍的是使用应用模板部署DeepSeek,在阿里云权益中心:https://www.aliyun.com/benefit 申请个人或企业的上云权益,如下图:
方式一:应用模板部署
1. 创建项目
登录函数计算3.0控制台,在左侧导航栏单击Function AI,在Funciton AI页面导航栏,选择项目,然后单击创建项目,选择基于模板创建。
说明
当左上角显示函数计算FC 3.0时,表示当前控制台为3.0控制台。
2. 部署模板
- 在搜索栏输入
DeepSeek进行搜索,单击基于 DeepSeek-R1 构建AI 聊天助手,进入模板详情页,单击立即部署。
- 选择地域,单击部署项目,在项目资源预览对话框中,您可以看到相关的计费项,详情请见计费涉及的产品。单击确认部署,部署过程大约持续 10 分钟左右,状态显示已部署表示部署成功。说明
- 选择地域时,一般是就近选择地域信息,如果已经开启了NAS文件系统,选择手动配置模型存储时,请选择和文件系统相同的地域。
- 如果您在测试调用的过程中遇到部署异常或模型拉取失败,可能是当前地域的GPU显卡资源不足,建议您更换地域进行重试。
3. 验证应用
部署完毕后,点击Open-WebUI服务,在访问地址内找到公网访问单击访问。