Q&A | 零门槛,即刻拥有DeepSeek-R1满血版

简介: 在博文发布后,博主醇青酱提出了关于DeepSeek-R1模型部署的问题。本文针对其疑问进行详细解答,并补充说明了其他三种方案同样支持DeepSeek-R1的部署,具体操作可参考官方文档。文中还提供了详细的命令行示例和图片指引,帮助用户更好地理解和部署模型。若还有其他问题,欢迎继续提问。原文路径:[零门槛、百万token免费用,即刻拥有DeepSeek-R1满血版](https://developer.aliyun.com/article/1652705?spm=a2c6h.13046898.publish-article.4.220b6ffa53YMKA)

在发布了这篇博文之后,有博主给我留言提出了自己的问题,由于原文比较长,这里不再原文后继续追加,而是重新补充博文来记录。在这里,也非常欢迎其他博主来提出自己的疑问,能解答的我都会详细解答的。

原文路径:

零门槛、百万token免费用,即刻拥有DeepSeek-R1满血版,还有实践落地调用场景等你来看

问题一

非常感谢博主 醇青酱 提出的问题,这里是我个人的习惯,希望从上到下的标题保持一致,引起了歧义,稍后我会进行修改,这里先对博主的问题进行回复

image.png

对于博主的疑问,其他三种方案同样是支持DeepSeek-R1 模型版本部署的,文中只是以 蒸馏版模型部署 DeepSeek-R1-Distill-Qwen-7B 作为示例进行操作的,这一点在官方的部署文档中有明确的细分

image.png

如果你需要部署DeepSeek-R1 模型 ,也都是可以的。

对于方案二,你可以在如下页面选择部署DeepSeek-R1 模型

image.png

但是目前没有资源,另外即使有的话资源也比较贵,个人承担的话有点力不从心

image.png

对于方案三,你可以理解为现在部署的就是 DeepSeek-R1 模型,在原部署方案中有详细的介绍【通过云原生应用开发平台 CAP 部署 Ollama 和Open WebUI 两个 FC 函数。Ollama 负责托管 lmstudio-community/DeepSeek-R1-Distill-Qwen-7B-GGUF 模型,它是基于 DeepSeek-R1 的推理能力,通过蒸馏技术将推理模式迁移到较小的 Qwen 模型上,从而在保持高效性能的同时降低了计算成本。】我在文中没有详细写是为了避免大段的复制官方文档,所以才没有粘贴这段话。

对于方案四,同样也是支持部署DeepSeek-R1方案的,只是需要你在部署的时候指定具体的模型名称,部署文档默认是 deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

/bin/bash -c "$(curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/vllm_install.sh)" -- deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

如果想要部署 DeepSeek-R1 模型的话,那么你需要替换 deepseek-ai/DeepSeek-R1-Distill-Qwen-7B 为新的模型,

image.png

替换为部署 DeepSeek-R1 模型之后的部署命令如下

/bin/bash -c "$(curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/vllm_install.sh)" -- deepseek-ai/DeepSeek-R1

问题二

关于我的文章中基于函数计算FC部署DeepSeek-R1 蒸馏版方案中,提到的Web 页面无法打开对话页面体验的问题,这里做一个更新,具体的更新内容如下。

这个问题其实是我操作的问题,正确的操作应该是点击部署页面左侧的【open-webui】,查看该tab下的访问地址,

41abc2365becf54d3bafb57ecc509e2.png

点击访问地址之后就可以正常跳转到在线的Web页面体验DeepSeek-R1 的效果了,并且加载挺快,回答挺快,最终的效果如图

9137d938421fcdcc2d1cc15b192f38a.png

原来的文章中点击的访问域名本来就是对应API 接口访问的地址,而不是 webui 的访问地址,因此在浏览器中无法打开,但是在 Chatbox 以及 HTTP调用工具中都是可以正常返回的。


若还有其他问题,欢迎大家提问。

相关文章
|
人工智能 Java 程序员
通义灵码 2.0 | AI程序员 荣耀登场
通义灵码2.0引入了AI程序员,具备多文件代码修改和使用工具的能力,可帮助开发者完成需求实现、问题解决、单元测试用例生成等任务。相比1.0版本,2.0在代码生成速度、准确度及自然语言理解方面有显著提升,支持更多上下文类型如#file、#codeChanges等,便于灵活提问与代码审查。本文通过实际操作展示了AI程序员在功能开发、跨语言编程等方面的应用,体验良好;但在单元测试环节遇到环境检查问题未能解决,希望后续能提供更详细的修复文档。总体而言,AI程序员大幅提升了开发效率,尤其在新功能迭代和错误排查方面表现出色,但生成的代码风格有时需人工调整以适应现有项目结构。
|
人工智能 算法 Java
零门槛、百万token免费用,即刻拥有DeepSeek-R1满血版,还有实践落地调用场景等你来看
DeepSeek 是热门的推理模型,能在少量标注数据下显著提升推理能力,尤其擅长数学、代码和自然语言等复杂任务。本文涵盖四种部署方案,可以让你快速体验云上调用 DeepSeek-R1 满血版的 API 及部署各尺寸模型的方式,无需编码,最快 5 分钟、最低 0 元即可实现
|
人工智能 安全 Linux
安全体检 | 服务器的终极卫士
阿里云的安全体检是为用户提供的一项免费安全检测工具,旨在通过调用云安全中心和配置审计中的安全检测能力,汇总检测结果,涵盖病毒攻击、风险配置和服务器漏洞三方面。该服务帮助用户及时发现并解决潜在的安全问题,提升云上安全水平。与云服务诊断不同,安全体检更侧重于深层次的安全检测,确保服务器的安全稳定运行。
安全体检 | 服务器的终极卫士
|
SQL 分布式计算 DataWorks
MaxCompute MaxFrame评测 | 分布式Python计算服务MaxFrame(完整操作版)
在当今数字化迅猛发展的时代,数据信息的保存与分析对企业决策至关重要。MaxCompute MaxFrame是阿里云自研的分布式计算框架,支持Python编程接口、兼容Pandas接口并自动进行分布式计算。通过MaxCompute的海量计算资源,企业可以进行大规模数据处理、可视化数据分析及科学计算等任务。本文将详细介绍如何开通MaxCompute和DataWorks服务,并使用MaxFrame进行数据操作。包括创建项目、绑定数据源、编写PyODPS 3节点代码以及执行SQL查询等内容。最后,针对使用过程中遇到的问题提出反馈建议,帮助用户更好地理解和使用MaxFrame。
|
7月前
|
数据可视化 数据挖掘 关系型数据库
借助 MCP 赋能数据可视化,让数据‘燃’起来
在数字化时代,数据成为企业竞争的关键资源。MCP工具作为“数据中转站”和“智能翻译官”,可连接阿里云PolarDB MySQL数据库,通过拖拽操作实现零代码数据分析,降低技术门槛。结合阿里云百炼大模型,用户只需输入自然语言即可生成可视化图表,快速获取数据洞察,助力企业高效决策。
|
人工智能 自然语言处理 算法
AI 对研发流程的变革
AI编程助手通过自然语言生成代码、解释复杂算法、优化代码等,极大提升了开发效率与代码质量。开发者可利用通义灵码进行代码解释、生成注释及单元测试,简化开发流程。在需求分析、设计、编码、测试到部署的全流程中,AI助手表现优异,尤其在编码和测试阶段显著提高工作效率。尽管目前AI助手在需求分析方面尚需改进,但其未来发展潜力巨大,有望逐步替代部分人力工作。体验地址:[阿里云智能编码](https://www.aliyun.com/solution/tech-solution/intelligent-coding)。
|
11月前
|
人工智能 自然语言处理 应用服务中间件
Bolt.diy 创意建站方案测评 | 不懂代码,你也可以快速建站
本文详细介绍了一款名为Bolt.diy的创意建站工具的使用流程与功能体验。Bolt.diy是阿里云推出的一款基于自然语言交互的Web开发工具,用户可通过简单描述需求快速生成个性化网站。文章从开通服务、配置API-Key到实际创建网站进行了详细步骤解析,并展示了如何通过本地nginx部署生成的代码。此外,还尝试了优化初级会计考试招生宣传页面的过程,发现目前工具在图片资源处理和一键发布功能上存在局限性。整体来看,Bolt.diy操作便捷、成本可控,适合个人及企业低成本验证创意需求。
|
前端开发 Java 测试技术
基于Qwen2.5-Coder 快速搭建应用管理系统
本文介绍了如何利用Qwen2.5-Coder快速搭建一个应用管理系统。通过访问ModelScope通义千问Qwen模型库,选择Qwen2.5-Coder模型,生成Spring Boot项目代码包,并逐步解决项目运行中遇到的问题,如Java版本不兼容等。文章还展示了如何优化用户管理页面的功能和样式,最终实现了从零代码到完整应用的搭建过程,提供了良好的用户体验和开发效率。附带的可运行代码链接为:[https://gitee.com/null_096_1927/demo](https://gitee.com/null_096_1927/demo)。
基于Qwen2.5-Coder 快速搭建应用管理系统
|
5月前
|
开发工具 git Windows
Git 提示文件名过长问题处理
本文介绍了Git下载代码时因文件路径过长导致“Filename too long”错误的解决方案。通过检查并设置`core.longpaths`参数为true,可解决该问题。建议保持Git版本更新,多数情况下无需手动配置。
|
10月前
|
SQL 人工智能 自然语言处理
通义灵码2.5 | 一个更懂开发者的 AI 编程助手
通义灵码2.5版是一款强大的AI编程助手,具备智能体模式,支持自主决策、环境感知与工具使用等功能。通过工程检索、文件编辑和终端操作,可端到端完成编码任务,并深度适配Qwen3模型,大幅提升开发效率。新版新增行间建议预测、上下文分析及记忆功能,更懂开发者需求。智能体结合MCP工具,能实现从代码生成到部署的全流程自动化,如文中实例展示的数独小游戏开发与在线部署。无论是日常开发还是创意实现,通义灵码都能显著提升工作效率与能力边界。