Q&A | 零门槛,即刻拥有DeepSeek-R1满血版

简介: 在博文发布后,博主醇青酱提出了关于DeepSeek-R1模型部署的问题。本文针对其疑问进行详细解答,并补充说明了其他三种方案同样支持DeepSeek-R1的部署,具体操作可参考官方文档。文中还提供了详细的命令行示例和图片指引,帮助用户更好地理解和部署模型。若还有其他问题,欢迎继续提问。原文路径:[零门槛、百万token免费用,即刻拥有DeepSeek-R1满血版](https://developer.aliyun.com/article/1652705?spm=a2c6h.13046898.publish-article.4.220b6ffa53YMKA)

在发布了这篇博文之后,有博主给我留言提出了自己的问题,由于原文比较长,这里不再原文后继续追加,而是重新补充博文来记录。在这里,也非常欢迎其他博主来提出自己的疑问,能解答的我都会详细解答的。

原文路径:

零门槛、百万token免费用,即刻拥有DeepSeek-R1满血版,还有实践落地调用场景等你来看

问题一

非常感谢博主 醇青酱 提出的问题,这里是我个人的习惯,希望从上到下的标题保持一致,引起了歧义,稍后我会进行修改,这里先对博主的问题进行回复

image.png

对于博主的疑问,其他三种方案同样是支持DeepSeek-R1 模型版本部署的,文中只是以 蒸馏版模型部署 DeepSeek-R1-Distill-Qwen-7B 作为示例进行操作的,这一点在官方的部署文档中有明确的细分

image.png

如果你需要部署DeepSeek-R1 模型 ,也都是可以的。

对于方案二,你可以在如下页面选择部署DeepSeek-R1 模型

image.png

但是目前没有资源,另外即使有的话资源也比较贵,个人承担的话有点力不从心

image.png

对于方案三,你可以理解为现在部署的就是 DeepSeek-R1 模型,在原部署方案中有详细的介绍【通过云原生应用开发平台 CAP 部署 Ollama 和Open WebUI 两个 FC 函数。Ollama 负责托管 lmstudio-community/DeepSeek-R1-Distill-Qwen-7B-GGUF 模型,它是基于 DeepSeek-R1 的推理能力,通过蒸馏技术将推理模式迁移到较小的 Qwen 模型上,从而在保持高效性能的同时降低了计算成本。】我在文中没有详细写是为了避免大段的复制官方文档,所以才没有粘贴这段话。

对于方案四,同样也是支持部署DeepSeek-R1方案的,只是需要你在部署的时候指定具体的模型名称,部署文档默认是 deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

/bin/bash -c "$(curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/vllm_install.sh)" -- deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

如果想要部署 DeepSeek-R1 模型的话,那么你需要替换 deepseek-ai/DeepSeek-R1-Distill-Qwen-7B 为新的模型,

image.png

替换为部署 DeepSeek-R1 模型之后的部署命令如下

/bin/bash -c "$(curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/vllm_install.sh)" -- deepseek-ai/DeepSeek-R1

问题二

关于我的文章中基于函数计算FC部署DeepSeek-R1 蒸馏版方案中,提到的Web 页面无法打开对话页面体验的问题,这里做一个更新,具体的更新内容如下。

这个问题其实是我操作的问题,正确的操作应该是点击部署页面左侧的【open-webui】,查看该tab下的访问地址,

41abc2365becf54d3bafb57ecc509e2.png

点击访问地址之后就可以正常跳转到在线的Web页面体验DeepSeek-R1 的效果了,并且加载挺快,回答挺快,最终的效果如图

9137d938421fcdcc2d1cc15b192f38a.png

原来的文章中点击的访问域名本来就是对应API 接口访问的地址,而不是 webui 的访问地址,因此在浏览器中无法打开,但是在 Chatbox 以及 HTTP调用工具中都是可以正常返回的。


若还有其他问题,欢迎大家提问。

相关文章
|
人工智能 算法 Java
零门槛、百万token免费用,即刻拥有DeepSeek-R1满血版,还有实践落地调用场景等你来看
DeepSeek 是热门的推理模型,能在少量标注数据下显著提升推理能力,尤其擅长数学、代码和自然语言等复杂任务。本文涵盖四种部署方案,可以让你快速体验云上调用 DeepSeek-R1 满血版的 API 及部署各尺寸模型的方式,无需编码,最快 5 分钟、最低 0 元即可实现
|
3月前
|
开发工具 git Windows
Git 提示文件名过长问题处理
本文介绍了Git下载代码时因文件路径过长导致“Filename too long”错误的解决方案。通过检查并设置`core.longpaths`参数为true,可解决该问题。建议保持Git版本更新,多数情况下无需手动配置。
|
10月前
|
人工智能 Java 程序员
《通义灵码2.0 AI 程序员体验官招募》 获奖名单公布
《通义灵码2.0 AI 程序员体验官招募》 获奖名单公布
358 1
|
人工智能 自然语言处理 Shell
深度评测 | 仅用3分钟,百炼调用满血版 Deepseek-r1 API,百万Token免费用,简直不要太爽。
仅用3分钟,百炼调用满血版Deepseek-r1 API,享受百万免费Token。阿里云提供零门槛、快速部署的解决方案,支持云控制台和Cloud Shell两种方式,操作简便。Deepseek-r1满血版在推理能力上表现出色,尤其擅长数学、代码和自然语言处理任务,使用过程中无卡顿,体验丝滑。结合Chatbox工具,用户可轻松掌控模型,提升工作效率。阿里云大模型服务平台百炼不仅速度快,还确保数据安全,值得信赖。
358864 71
深度评测 | 仅用3分钟,百炼调用满血版 Deepseek-r1 API,百万Token免费用,简直不要太爽。
|
5月前
|
数据可视化 数据挖掘 关系型数据库
借助 MCP 赋能数据可视化,让数据‘燃’起来
在数字化时代,数据成为企业竞争的关键资源。MCP工具作为“数据中转站”和“智能翻译官”,可连接阿里云PolarDB MySQL数据库,通过拖拽操作实现零代码数据分析,降低技术门槛。结合阿里云百炼大模型,用户只需输入自然语言即可生成可视化图表,快速获取数据洞察,助力企业高效决策。
|
人工智能 编解码 算法
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
本文介绍了通义灵码2.0 AI程序员在嵌入式开发中的实战应用。通过安装VS Code插件并登录阿里云账号,用户可切换至DeepSeek V3模型,利用其强大的代码生成能力。实战案例中,AI程序员根据自然语言描述快速生成了C语言的base64编解码算法,包括源代码、头文件、测试代码和CMake编译脚本。即使在编译错误和需求迭代的情况下,AI程序员也能迅速分析问题并修复代码,最终成功实现功能。作者认为,通义灵码2.0显著提升了开发效率,打破了编程语言限制,是AI编程从辅助工具向工程级协同开发转变的重要标志,值得开发者广泛使用。
9077 71
DeepSeek加持的通义灵码2.0 AI程序员实战案例:助力嵌入式开发中的算法生成革新
|
人工智能 自然语言处理 API
快速使用 DeepSeek-R1 满血版
DeepSeek是一款基于Transformer架构的先进大语言模型,以其强大的自然语言处理能力和高效的推理速度著称。近年来,DeepSeek不断迭代,从DeepSeek-V2到参数达6710亿的DeepSeek-V3,再到性能比肩GPT-4的DeepSeek-R1,每次都带来重大技术突破。其开源策略降低了AI应用门槛,推动了AI普惠化。通过阿里云百炼调用满血版API,用户可以快速部署DeepSeek,享受高效、低成本的云端服务,最快10分钟完成部署,且提供免费token,极大简化了开发流程。
191817 31
快速使用 DeepSeek-R1 满血版
|
9月前
|
人工智能 自然语言处理 应用服务中间件
Bolt.diy 创意建站方案测评 | 不懂代码,你也可以快速建站
本文详细介绍了一款名为Bolt.diy的创意建站工具的使用流程与功能体验。Bolt.diy是阿里云推出的一款基于自然语言交互的Web开发工具,用户可通过简单描述需求快速生成个性化网站。文章从开通服务、配置API-Key到实际创建网站进行了详细步骤解析,并展示了如何通过本地nginx部署生成的代码。此外,还尝试了优化初级会计考试招生宣传页面的过程,发现目前工具在图片资源处理和一键发布功能上存在局限性。整体来看,Bolt.diy操作便捷、成本可控,适合个人及企业低成本验证创意需求。
|
8月前
|
SQL 人工智能 自然语言处理
通义灵码2.5 | 一个更懂开发者的 AI 编程助手
通义灵码2.5版是一款强大的AI编程助手,具备智能体模式,支持自主决策、环境感知与工具使用等功能。通过工程检索、文件编辑和终端操作,可端到端完成编码任务,并深度适配Qwen3模型,大幅提升开发效率。新版新增行间建议预测、上下文分析及记忆功能,更懂开发者需求。智能体结合MCP工具,能实现从代码生成到部署的全流程自动化,如文中实例展示的数独小游戏开发与在线部署。无论是日常开发还是创意实现,通义灵码都能显著提升工作效率与能力边界。