DeepSeek-R1阿里云上部署解析:API、Serverless、容器、GPU四种部署方案实操对比及避坑指南

简介: DeepSeek-R1是当下综合表现极为突出的大语言模型,在复杂数学推理、工程代码编写、长文本逻辑梳理、多轮专业对话等场景中能力出众,被大量开发者、技术团队以及企业所使用。但该模型庞大的参数量,给普通用户带来了极高的本地部署门槛,其满血版参数规模达到671B,完整运行至少需要8卡A100级别高性能GPU,个人电脑、常规工作站完全无法承载,这也是多数使用者面临的首要难题。

一、前言:DeepSeek-R1部署痛点与阿里云整体方案介绍

DeepSeek-R1是当下综合表现极为突出的大语言模型,在复杂数学推理、工程代码编写、长文本逻辑梳理、多轮专业对话等场景中能力出众,被大量开发者、技术团队以及企业所使用。但该模型庞大的参数量,给普通用户带来了极高的本地部署门槛,其满血版参数规模达到671B,完整运行至少需要8卡A100级别高性能GPU,个人电脑、常规工作站完全无法承载,这也是多数使用者面临的首要难题。

除硬件门槛外,使用者还会遇到一系列衍生问题:直接调用第三方公共API,会产生业务代码、涉密文档等敏感数据泄露风险;小型团队多人协同使用模型时,缺少统一、可控的私有化访问入口;采用传统GPU服务器长时运行,按小时计费模式容易造成成本失控,产生高额账单。针对以上行业共性痛点,阿里云推出零门槛部署DeepSeek-R1综合解决方案,划分出四个梯度分明的部署方式,覆盖纯线上API调用、Serverless轻量化部署、企业容器集群部署、GPU服务器手动部署四大场景,从零基础体验到深度定制微调,完整覆盖不同技术能力、不同业务需求的用户群体。

本文将结合完整实测流程,逐一拆解四种部署方式的操作步骤、核心命令、运行特性,同步记录部署过程中出现的各类问题与对应的解决办法,完成全维度成本核算,最后结合使用场景给出精准的方案选型建议,帮助不同需求的用户快速找到适配的部署路径。整体方案按照“部署难度由低到高、可控性由弱到强、成本由少到多”依次排布,新手可从最简单的API调用入手,专业研发团队可直接落地生产级集群方案。阿里云部署AI Agent:OpenClaw/Hermes Agent全网最简单,只需两步,详情👉访问阿里云OpenClaw/Hermes一键部署专题页面 了解。
OpenClaw1.png
OpenClaw2.png
OpenClaw02.png
openClaw3.png
OpenClaw031.png
OpenClaw03.png
OpenClaw04.png
OpenClaw5.png
Openclaw6.png
Token Plan Token最便宜/支持多模型切换:👉访问订阅阿里云百炼Token Plan AI大模型服务 。支持多模型切换,用于多模态模型灵活调用,实现多模型、多工具、多场景下的额度共享与统一管理,兼顾灵活性、稳定性与安全性,大幅降低企业使用大模型的门槛与成本。
tokenplan1.png
tokenplan1.png
tokenplan2.png
tokenplan3.png
tokenplan4.png

二、四大部署方案整体架构与核心定位

在正式进入实操环节前,先梳理四种部署方式的定位、适用人群与基础差异,帮助读者建立整体认知。四种方案分别为百炼模型API调用、函数计算FC Serverless部署、容器服务集群部署、GPU云服务器手动部署,不同方案在部署耗时、运维成本、模型权限、数据安全性上区别显著。

百炼模型API调用属于零部署模式,无需搭建任何服务器与运行环境,开通服务后即可调用,主打即开即用,适合原型验证、个人低频使用、快速体验模型效果,计费方式为按Token消耗结算,起步成本为0元。函数计算FC为5分钟级零代码Serverless部署,依托云上弹性算力,自动完成资源扩缩容,主打轻量化私有化应用,适合小型团队轻量调用、事件驱动型业务,成本按资源使用时长与调用次数综合计算,月度起步费用极低。

容器服务集群部署面向企业生产环境,支持DeepSeek-R1满血版稳定运行,具备高并发、集群化调度能力,适合中大型企业核心业务、大规模推理场景,部署复杂度中等,硬件与运维成本偏高。GPU云服务器手动部署则拥有最高的自由度,使用者可自定义模型推理参数、执行模型量化、开展模型微调工作,适合AI算法研究员、深度定制需求团队,部署耗时最长,运维负担与硬件成本也处于最高水平。

整体规律清晰:部署方式越偏向底层硬件,用户获得的控制权越强,但部署复杂度、运维压力、资金成本也同步提升。接下来将按照从易到难的顺序,逐一完成全流程实操讲解,并附带可直接复制使用的代码命令、问题排查方案。

三、方案一:百炼模型API调用——零部署即开即用,新手首选

3.1 整体流程与实操步骤

该方案是所有方式中最简单的一种,全程无需配置服务器、安装运行环境,仅需完成账号开通、密钥创建两个基础步骤,通过标准API接口即可调用DeepSeek系列模型,接口完全兼容OpenAI格式,适配绝大多数主流客户端与开发程序。

第一步,登录阿里云控制台,进入百炼大模型服务平台,完成服务开通与账号基础配置。第二步,进入密钥管理页面,创建专属API Key,该密钥是调用接口的核心凭证,创建完成后及时复制保存,页面仅单次展示完整密钥。第三步,根据业务需求选择对应模型名称,通过curl命令、编程语言SDK等方式发起调用,支持普通对话与流式输出两种模式。

3.2 核心调用命令(curl示例)

流式输出是大模型交互的常用模式,能够逐段返回生成内容,模拟实时对话效果,对应的调用命令如下,将命令中的$DASHSCOPE_API_KEY替换为自己创建的密钥即可直接执行:

curl https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
  -d '{
    "model": "deepseek-r1",
    "messages": [
      {"role": "user", "content": "用 Python 实现一个快速排序算法,要求原地排序,并添加详细代码注释"}
    ],
    "stream": true
  }'

实测环境下,开启流式输出后,首个Token的返回延迟仅2至3秒,推理效果与官方原生版本保持一致。除满血版deepseek-r1外,平台还提供多款衍生模型,不同模型参数与适用场景划分明确:deepseek-r1为671B满血版,专攻复杂数学、深度代码推理;deepseek-r1-distill-qwen-32b为32B蒸馏版,轻量化设计,适配日常问答、基础代码辅助;deepseek-v3同样为671B参数,主打通用对话、长篇内容生成。

3.3 实测踩坑问题与解决方案

在实测调用过程中,主要遇到两处高频问题,也是多数新手容易忽略的细节。
第一类问题为模型名称混淆。很多用户不区分三款模型的定位,随意填写模型名称,导致返回结果不符合预期。例如使用deepseek-v3执行复杂算法推理,效果远不如deepseek-r1。解决方案:根据业务场景严格匹配模型名称,复杂推理选用deepseek-r1,日常办公选用蒸馏版,通用内容生成选用deepseek-v3

第二类问题为API Key权限错误,返回403状态码。百炼平台将密钥分为个人Key与应用Key两类,两类密钥的调用规则不同。如果创建的是应用类型密钥,调用接口时必须额外增加X-DashScope-AppId请求头,并填入对应的应用ID,否则会直接鉴权失败。排查建议:优先确认密钥类型,个人密钥可直接使用上述命令,应用密钥补充对应请求头即可修复问题。

3.4 方案总结与计费说明

该方案文档指引清晰,图文步骤完整,上手门槛极低。计费模式为纯Token计费,新用户可领取免费Token额度,适合临时测试、个人学习、原型对接等场景。不足之处在于数据会在云上传输,对于极致数据保密的场景并不适用,同时无法自定义模型推理参数,所有配置均沿用平台默认规则。

四、方案二:函数计算FC——5分钟零代码Serverless私有化部署

4.1 整体流程与实操步骤

函数计算FC是阿里云Serverless核心产品,本次部署方案将DeepSeek蒸馏版模型封装为云上函数,依托GPU实例运行,全程无需编写业务代码,整体部署耗时控制在5分钟左右,兼顾私有化部署、自动扩缩容两大优势,是小型团队的高性价比选择。

完整部署步骤:第一,登录函数计算FC控制台,点击左侧「应用」模块,选择「创建应用」;第二,在模板市场中检索关键词“DeepSeek”,选中官方专属部署模板;第三,选择GPU实例规格,官方推荐fc.gpu.tesla.1配置,适配7B、14B主流蒸馏模型;第四,确认配置后一键发起部署,等待3至5分钟即可完成。部署成功后,系统会自动生成HTTP触发器URL,所有外部请求均通过该地址转发。

4.2 核心调用命令(curl示例)

部署完成后,使用下方命令调用函数计算中的DeepSeek蒸馏模型,将URL替换为自身的触发器地址即可:

curl -X POST https://<your-fc-url>.cn-hangzhou.fc.aliyuncs.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-r1-distill",
    "messages": [
      {"role": "user", "content": "详细解释计算机领域中的CAP定理,并举例说明应用场景"}
    ]
  }'

4.3 实测踩坑问题与优化方案

该方案实测中出现两大典型故障,分别为部署超时、冷启动延迟,同时对应成熟的优化手段。
问题一:首次部署超时失败。DeepSeek蒸馏版镜像体积约8GB,默认的函数实例启动超时时间为300秒,镜像拉取过程中容易超出时限,导致部署中断。解决方案:进入函数配置页面,将「实例启动超时时间」从300秒调整为600秒,重新执行部署操作即可顺利完成。

问题二:长时间闲置后出现冷启动延迟。函数计算按需调度资源,服务闲置一段时间后实例会被回收,再次调用时需要重新拉起实例,实测冷启动耗时达到25至35秒,严重影响实时交互体验。优化方案:开启预留实例功能,仅配置1个预留实例即可,实例持续在线,可将延迟压缩至1秒以内,完全满足日常交互需求。预留实例按在线时长计费,单日成本可控。

4.4 详细成本核算

以使用量中等的场景为例,选用fc.gpu.tesla.1规格(1/4 A100显卡),结合按需调用+预留实例模式,成本明细如下:单GPU实例按时计费标准为3.5元/小时;单个预留实例全天运行,单日费用为84元;每日100次常规请求、单次平均执行5秒,按需调用部分单日费用约0.49元。

综合计算:纯按需调用模式下,月度费用仅15元左右;开启单个预留实例全天运行,月度费用约2520元。结合多数小型团队使用习惯,推荐搭配方案为1个预留实例+按需调用,综合月度成本约120元,兼顾响应速度与成本优势。

4.5 方案总结

函数计算FC部署方案实现了轻量化私有化,所有数据运行在用户专属VPC内部,规避数据泄露风险,同时平台自动完成算力扩缩容,几乎无需人工运维。该方案仅支持DeepSeek蒸馏版模型,无法运行671B满血版,适合5至10人小型团队、轻量AI应用、事件驱动型业务。

五、方案三:容器服务集群部署——企业级生产环境,满血版稳定运行

5.1 整体流程与YAML配置文件

对于需要部署DeepSeek-R1 671B满血版的中大型企业,容器服务ACK/ACS集群方案是标准生产级选择,依托Kubernetes容器编排能力,实现多节点调度、高并发承载、服务高可用,整体部署分为集群创建、vLLM推理服务部署、服务暴露三个核心步骤。

第一步,创建容器集群,选择GPU节点池,官方推荐ecs.gn7i-c32g1.32xlarge规格,搭载4张A100显卡,满足满血版基础运行需求;第二步,通过Helm Chart或YAML配置文件部署vLLM推理框架,vLLM是当下主流的大模型推理加速工具,可大幅提升吞吐效率;第三步,创建Service与Ingress资源,对内、对外暴露模型访问接口。

以下为完整的deployment.yaml配置文件,可直接应用于集群,定义了容器镜像、模型路径、GPU资源限制、推理参数等核心内容:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: deepseek-vllm
spec:
  replicas: 1
  selector:
    matchLabels:
      app: deepseek-vllm
  template:
    metadata:
      labels:
        app: deepseek-vllm
    spec:
      containers:
        - name: vllm
          image: vllm/vllm-openai:latest
          command: [ "python3", "-m", "vllm.entrypoints.openai.api_server" ]
          args:
            - "--model"
            - "/models/deepseek-r1"
            - "--tensor-parallel-size"
            - "4"
            - "--gpu-memory-utilization"
            - "0.95"
            - "--max-model-len"
            - "8192"
          ports:
            - containerPort: 8000
          resources:
            limits:
              nvidia.com/gpu: 4
          volumeMounts:
            - name: model-storage
              mountPath: /models
      volumes:
        - name: model-storage
          persistentVolumeClaim:
            claimName: deepseek-model-pvc

配置中tensor-parallel-size代表张量并行数量,需要和集群单节点GPU卡数保持一致,max-model-len限制模型最大上下文长度,可根据业务调整。

5.2 实测踩坑问题与解决办法

该方案硬件要求高、部署链路长,实测中遇到三处核心问题:
问题一:模型下载耗时过长。DeepSeek-R1满血版权重文件约750GB,默认在线下载模式耗时超过47分钟,远超文档标注的120分钟整体部署时长。优化方案:提前使用ossutil工具将模型文件上传至对象存储OSS,再通过存储卷挂载至容器集群,跳过在线下载环节,大幅缩短部署时间。

问题二:张量并行参数配置错误,引发OOM内存溢出。部分用户根据集群总显卡数设置tensor-parallel-size,忽略单节点显卡限制。例如单节点仅4张A100,却将参数设置为8,直接导致服务崩溃。解决办法:该参数必须与单节点GPU数量保持一致,本示例中固定设置为4。

问题三:硬件规格不足无法运行满血版。实测验证,DeepSeek-R1 671B满血版在FP16精度下,至少需要8张A100 80GB显卡,4卡节点仅能通过INT4、INT8量化降低显存占用才能运行。如果硬件无法升级,可在配置文件中调低gpu-memory-utilization参数,或选用量化后的模型文件。

5.3 硬件成本核算

容器集群方案硬件成本较高,不同GPU节点包月费用明细如下:ecs.gn7i-c32g1.32xlarge(4×A100)月度费用85000元以上;ecs.gn7i-c32g1.16xlarge(2×A100)月度费用42000元以上;ecs.gn6v-c8g1.8xlarge(1×V100)月度费用7000元以上。该方案仅建议有高并发、满血版刚需的企业选用,普通测试场景不推荐。

5.4 方案总结

容器集群方案具备企业级高可用、高并发能力,支持模型横向扩容,数据完全私有化。缺点是部署复杂度高、需要Kubernetes运维能力,硬件成本昂贵,仅面向大中型企业生产业务。

六、方案四:GPU云服务器手动部署——极致自由,支持模型微调与量化

6.1 整体流程与分步命令

该方案基于GPU云服务器纯手动部署,用户拥有完整的环境控制权,可自由完成模型量化、推理参数自定义、模型微调等深度操作,适合AI算法工程师、模型研究人员。整体选用Ubuntu 22.04 GPU专用镜像,分步操作命令如下。

第一步,远程登录GPU实例,更新系统并安装基础依赖:

sudo apt update && sudo apt install -y python3-pip nvidia-cuda-toolkit

第二步,安装vLLM、transformers、torch等模型运行依赖库:

pip install vllm transformers torch

第三步,安装模型下载工具huggingface_hub,并拉取DeepSeek-R1-Distill-Qwen-7B蒸馏版模型至本地目录:

pip install huggingface_hub
huggingface-cli download deepseek-ai/DeepSeek-R1-Distill-Qwen-7B \
  --local-dir /models/DeepSeek-R1-Distill-Qwen-7B

第四步,启动vLLM推理服务,指定端口、显存利用率等参数:

python3 -m vllm.entrypoints.openai.api_server \
  --model /models/DeepSeek-R1-Distill-Qwen-7B \
  --port 8000 \
  --gpu-memory-utilization 0.9

6.2 实测踩坑问题与解决方案

问题一:CUDA版本不兼容。常规Ubuntu镜像自带CUDA 11.8版本,而新版vLLM要求CUDA 12.1及以上,直接安装会出现编译报错。解决办法:创建实例时,选择阿里云预装CUDA 12.4的GPU专用镜像,无需手动升级,完美适配vLLM。

问题二:系统磁盘空间不足。7B蒸馏版模型搭配Python运行环境,整体占用空间约40GB,服务器默认40GB系统盘会出现空间溢出。解决办法:创建GPU实例时,将系统盘扩容至100GB及以上,预留充足空间存放模型与依赖文件。

6.3 方案横向对比(四种部署模式汇总)

结合部署时长、模型自由度、成本、运维难度等维度,对四种方案做综合对比:

  1. 部署时长:百炼API(0分钟)> 函数计算(5分钟)> GPU服务器(2-3小时)> 容器集群(120分钟);
  2. 模型自由度:GPU服务器(完全自由)> 容器集群(支持满血/蒸馏版)> 函数计算(仅蒸馏版)> 百炼API(仅官方版本);
  3. 月度成本:百炼API(按Token计费,0元起)< 函数计算(120-2520元)< GPU服务器(7000元起)< 容器集群(42000元起);
  4. 运维难度:百炼API(无运维)< 函数计算(低运维)< 容器集群(中等运维)< GPU服务器(高运维);
  5. 适配人群:百炼API面向产品、前端、新手;函数计算面向后端、小型团队;容器集群面向企业运维、生产环境;GPU服务器面向AI算法、模型研究员。

七、综合选型建议、通用问题解答与总结

7.1 分场景选型指南

结合实测体验与成本、性能表现,针对不同使用场景给出明确选择:

  1. 个人学习、临时原型验证、偶尔调用:优先选择百炼模型API,零部署、零运维,免费额度即可满足基础使用;详情👉访问阿里云百炼大模型服务平台页面 了解
    bailian1.png
    bailian2.png
  2. 5-10人小型团队,用于代码审查、文档生成,兼顾数据安全与成本:首选函数计算FC,搭配1个预留实例,月成本可控,体验接近公共API;
  3. 中大型企业生产业务,需要满血版DeepSeek-R1、高并发推理:选择容器服务集群,依托集群能力保障业务稳定;
  4. AI算法研究、模型量化、自定义微调等深度开发工作:选择GPU云服务器手动部署,获取最大操作权限。

7.2 高频通用问题解答

Q1:DeepSeek-R1满血版和蒸馏版核心区别?
A:满血版671B参数,推理能力最强,硬件门槛与成本极高;蒸馏版通过知识蒸馏压缩参数,分为7B、14B、32B等版本,在代码辅助、日常对话场景中效果接近满血版,部署成本降低90%以上。

Q2:函数计算部署后如何保障数据安全?
A:函数运行在用户专属VPC内,可通过安全组、RAM权限、VPC绑定三重管控,推理数据全程不出专属网络,满足私有化安全要求。

Q3:函数计算能否部署671B满血版?
A:目前不支持,函数计算GPU实例显存规格有限,仅适配各类蒸馏版模型,满血版建议使用容器集群或百炼API。

7.3 全文总结

阿里云这套DeepSeek-R1部署方案形成了完整的能力梯度,从纯线上API到底层手动部署,覆盖全类型用户需求。文档整体步骤清晰,主流方案指引完善,仅在部分细节(如冷启动优化、模型前置下载、费用预警)上需要补充优化。

在实际使用过程中,有两个核心注意事项需要牢记:第一,GPU云服务器、容器集群属于高成本资源,闲置时务必及时释放,避免持续计费造成成本失控;第二,按需选择模型版本,绝大多数办公、代码辅助场景,蒸馏版模型完全可以胜任,无需盲目追求满血版,进一步压缩使用成本。对于不同技术背景的用户,可按照自身团队规模、数据安全要求、预算范围,从四大方案中挑选最优解,快速落地DeepSeek-R1大模型应用。

目录
相关文章
|
4天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
5天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
8637 37
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
5天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
654 4
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
5天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
659 5
|
5天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
727 148
|
5天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
5天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
566 2
|
5天前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
1961 10
|
5天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
1614 2
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
5天前
|
人工智能 运维 API
2026年阿里云百炼通义千问Qwen3.7-plus深度介绍 功能特性、使用优势及618大促订阅方案指南
大模型技术的普及,让AI能力逐步融入个人办公、内容创作、代码编写、企业运营、教育培训等各类场景。不同定位的模型对应不同使用需求,旗舰级模型性能强劲但使用成本偏高,轻量化模型价格低廉却难以胜任复杂任务,而介于两者之间的中端主力模型,凭借均衡的能力、亲民的定价、广泛的场景适配性,成为绝大多数个人用户、小型团队、中小企业的首选。
773 1