阿里云 AI 网关支持 DeepSeek V4

简介: 阿里云 AI 网关,提供 Model API、Agent API、MCP Server 的管理能力,现已率先支持 DeepSeek-V4 API 的管理。

作者:望宸、梧同


今天,DeepSeek 发布两个模型,V4-Pro 和 V4-Flash。其架构和技术优势可以总结为:

  • 架构升级:流形约束残差连接 mHC、Muon 优化器,提升训练质量。
  • 后训练范式升级:引入领域专家培育和 on-policy distillation(把所有专家熔融合到一个学生模型里),提升后训练效率和效果。
  • 全新的注意力机制:在 DSA 的基础上引入 CSA 和 HCA,提升 1M 上下文情况下的对话效果。


从而带来了模型效果和性价比方面的提升,包括 [1]:

  • Agent 能力大幅提高:在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距。
  • 丰富的世界知识:DeepSeek-V4-Pro 在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。
  • 世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。
  • 1M token 上下文,推理 FLOPs 只有上一代 V3.2 的 27%,KV cache 只要 10%。


DeepSeek-V4 支持 OpenAI ChatCompletions 接口与 Anthropic 接口。调用新模型 API 时,Model 参数需要改为 deepseek-v4-pro 或 deepseek-v4-flash。


阿里云 AI 网关,提供 Model API、Agent API、MCP Server 的管理能力,现已率先支持 DeepSeek-V4 API 的管理。 您可以通过阿里云 AI 网关,调用 DeepSeek-V4 API 服务,包括思考、多轮对话、Tool Call、Anthropic /v1/messages 兼容调用等功能,并支持在 Claude Code 上接入 DeepSeek-V4,此外,还实现了 DeepSeek-V4 和 Qwen 等其他模型之间的 Fallback 能力。


配置方式:

打开 AI 网关控制台 [ 2] 实例页面,在顶部菜单栏选择目标实例所在地域,并单击目标实例 ID。在左侧导航栏,单击 Model API,然后单击创建 Model API。

进入创建 Model API 表单后,您可按以下说明进行配置:

  • 协议:不同协议对应该场景下的一组内置默认路由,用于快速生成常用的 OpenAI/DashScope/vLLM 等兼容接口。
  • API 名称:您可自定义 API 名称,需注意名称必须全局唯一(同一账号下不可重复),支持英文、数字、下划线“_”、“-”,且不超过 64 个字符。
  • 域名:访问该 API 的域名,支持选择多个。域名与基本路径 BasePath 的组合必须唯一。
  • Base Path:配置 API 的基本请求路径,默认为 /。可选择是否启用转发至后端服务时移除**。


配置完后,进行用例测试:

相关链接:

[1]《DeepSeek-V4 预览版:迈入百万上下文普惠时代

[2] AI 网关控制台

https://www.aliyun.com/product/api-gateway/ai-gateway

相关文章
|
1月前
|
存储 自然语言处理 机器人
OpenClaw 搭团队太折腾?这个 Skill 一键搞定多智能体协作
OpenClaw是专为多智能体协作设计的基座,采用Actor架构,各Agent独立运行、消息驱动。针对协作失序、配置复杂等痛点,agentrun-team Skill提供一键组队能力:自动完成身份配置、构建团队意识与闭环流程,10分钟即可交付可协同、可审计、高透明的智能体团队。
|
1月前
|
运维 监控 安全
你的 OpenClaw 真的在受控运行吗?
本文基于 OpenClaw 与阿里云 SLS,将 Session 审计日志、应用日志与 OTEL 遥测统一汇入,搭建「日志 + 指标 + 链路」可观测体系,实现行为审计、运维观测与安全审计闭环,回答「Agent 是否在受控运行」。
304 19
|
1天前
|
存储 缓存 人工智能
当 Agent 从模型调用,走向系统工程:OpenAI 和 LangChain 的两种实践
OpenAI与LangChain最新实践揭示:AI Agent 正从“模型调用”迈向“系统工程”。前者以 WebSocket 优化API链路,提速40%;后者强调Feedback驱动Trace闭环,实现持续演进。效率与进化,缺一不可。
|
1月前
|
人工智能 运维 Serverless
零配置部署顶级模型!函数计算一键解锁 Qwen3.5
函数计算FunModel平台支持云上一键部署Qwen3.5-397B-A17B,5分钟完成上线。依托Serverless+GPU,实现弹性扩缩容,轻松实现高性能、低成本AI应用落地。
|
4月前
|
存储 人工智能 Java
用 AgentScope Java 开家 AI 奶茶店
开一家 AI 奶茶店,让 AgentScope Java 替你打理一切。
1366 48
|
2月前
|
存储 人工智能 安全
MSE Nacos Prompt 管理:让 AI Agent 的核心配置真正可治理
MSE Nacos 帮你把 Agent 的 Prompt 管起来。
202 19
|
19天前
|
人工智能 测试技术 API
阿里云 MSE AI Registry 公测开启:给你的 AI 资产一个专属的注册中心
AI Registry 公测开启,一文了解产品能力、AgentLoop 集成与 Skill 规划。
184 21
|
1月前
|
存储 人工智能 开发者
AI Agent 越来越难迭代,你缺少的不是功能
还在担心 Token 消耗过多?还在纠结 Agent 难以优化?不改一行业务代码,LoongSuite Python 探针帮你把一次请求从头到尾捋顺:哪一步访问了什么模型、调用了什么工具、召回了哪些文档、花费了多少 token、上下文发生了什么变化。
183 27
|
22天前
|
人工智能 安全 调度
HiClaw 上线 Worker 模板市场,提供稳定可共享的 Agent 生产力
HiClaw支持Worker模板,沉淀标准流程并稳定复用。
191 16
|
22天前
|
存储 运维 Serverless
给 OpenClaw 加上企业级 Memory,你的 Agent 终于不用再问第二遍
AgentLoop MemoryStore 是一款完全托管的企业级 Agent 记忆管理产品,具备开箱即用、灵活定制、Serverless 免运维三大优势,提供多维度记忆提取、智能记忆更新、异步流水线架构和分层检索等核心能力。
290 14