Claude Code + DeepSeek V4 唯一的遗憾要被补齐了:多模态识图灰度上线

简介: JeecgBoot AI专题研究 用 DeepSeek V4 几乎完美替代 Claude,唯一卡点就是不收图——这块短板马上要补上![](https://oscimg.oschina.net/oscnet/up9146c3ec0c19f2abe92a111fbac35c4e462.png) 一句

JeecgBoot AI专题研究 | 用 DeepSeek V4 几乎完美替代 Claude,唯一卡点就是不收图——这块短板马上要补上

一句话先说结论

DeepSeek V4 系列上线一周多,密集跑下来,Claude Code 接 DeepSeek V4-Pro 已经能完美替代原生 Claude 跑日常开发:写代码、改 bug、跑 Skills、生成报表大屏、自动化部署,全部丝滑。唯一让人难受的短板就是 V4 还不收图——架构图、设计稿、错误截图扔不进去,只能切回 Claude。

好消息是:4 月 29 日 DeepSeek 已经在 Web 端灰度推送识图模式,这块短板很快就要被补齐。如果你和我一样在用 Claude Code + DeepSeek 的组合,再忍两周,体验就会齐活。


这一周用下来:DeepSeek V4 真的能替代 Claude

我之前写过一篇 Claude Code + DeepSeek V4-Pro 真实评测,结论是"除了贵,没别的毛病"。这几天密集再压一轮,结论要更乐观一些——贵的问题随着用量上来已经被摊平了,稳定性反而是最大的安慰

具体替代效果分几条说:

① 代码生成与重构:基本无感切换

跑 JeecgBoot 的 Skills 生态——OA 流程自动搭建、积木 BI 大屏生成、钻取报表、自动化部署、Online 表单——这些场景下 DeepSeek V4-Pro 的输出质量和 Claude Sonnet 4.6 几乎打成平手。长上下文不掉链、工具调用准确率高、JSON 结构稳定,是工程化最看重的三个指标。

② 工具调用与 Skills 执行:兼容性满分

Anthropic 协议兼容层做得很到位,Claude Code 那一套 tools / tool_choice / tool_use 字段不需要改任何代码,直接换个 base URL 就能跑。Skills 执行链路里那些复杂的 nested tool call、多轮迭代修正、stream 模式,全部无缝

③ 账号稳定性:真正的解放

这条本来排不到这么靠前,但最近半年 Claude 账号批量被封的消息一波接一波,身边的同事中招的不少。DeepSeek 是国内主体、计费透明、合规清晰,再不用每天担心一觉醒来号没了——光这一条就值回票价。

④ 成本:日常开销降到 1/5

Opus 4.6 输入价 $15/百万 tokens,DeepSeek V4-Pro 是 ¥4/百万 tokens 左右(折合不到 $0.6),输入端便宜 25 倍以上。一天写 200 万 token 的开发者,月度账单从四位数美金降到三位数人民币,企业用量更明显。


那个让人坐立不安的"唯一短板":DeepSeek V4 不收图

舒服归舒服,但只要任务一旦涉及"看一眼这张图给点意见",DeepSeek 就立刻举手投降。

模型收到截图后,在界面上诚实地打印出一行字:

没错------它看不见图片

V4-Pro 当前版本是纯文本模型,完全不支持图片输入。

Claude Code 在发送图片时,V4-Pro 会收到一个占位符 [Image #1],但对实际图像内容毫无感知。所以你看到的那句"我无法直接查看图片"不是谦虚,是真的看不见。

对于日常编程工作流,这个限制影响面相当广:

  • 截图报错让模型分析 → ❌ 看不见
  • 发 UI 设计稿让模型写代码 → ❌ 看不见
  • 发报表渲染结果让模型诊断问题 → ❌ 看不见
  • 粘贴终端截图 → ❌ 看不见

社区里催识图能力的帖子从去年下半年到现在没断过,DeepSeek 团队也在 GitHub Issues 里多次回复"在做了在做了"。这次灰度上线,算是把欠了一年多的功课正式补上。

4 月 29 日的灰度推送:识图模式正式登场

灰度入口出现在 DeepSeek Web 端聊天框左下角的功能区,多了一个"识图"开关。开启后输入框右侧会出现回形针图标,可以直接拖拽或粘贴图片。API 端目前还没看到对应字段,但根据通常的灰度节奏,预计两周内会同步开放给 Pro 用户——这才是 Claude Code 用户真正等的那一天。

不是凭空出现:那些被忽略的多模态铺垫

很多人以为 DeepSeek 之前一直只做文本,识图能力是凭空冒出来。其实早就有伏笔,只是声量没那么大:

  • 2024 年 12 月 · DeepSeek-VL2:开源 MoE 架构多模态模型,3 个尺寸(3B / 16B / 27B 激活),覆盖通用视觉任务
  • 2025 年初 · Janus:统一视觉理解与生成的双流架构,解耦 encoder,生图与读图共享主干
  • 2025 年 · JanusFlow:引入 Rectified Flow 训练范式,被 CVPR 2025 主会议收录
  • 2025 年 · Janus-Pro:在 GenEval 基准上超越 DALL·E 3 与 Stable Diffusion,进入 SOTA 第一梯队

也就是说,DeepSeek 在多模态这条线上一直在砸论文和开源模型,缺的只是把它装进 Chat 主入口和 API 这一脚。这次灰度推送,本质上是把研究侧的能力正式产品化。

之前为什么迟迟不发?我个人猜测有两个原因:

  1. 算力优先级:V3 → V4 系列的迭代消耗了主力 GPU 集群,多模态推理对显存的额外开销让 PM 优先选了文本侧的提升
  2. 数据合规:图像里包含人脸、车牌、敏感场所等隐私元素,国内合规要求高,安全侧需要更长时间打磨

写在最后

这一周用 Claude Code + DeepSeek V4-Pro 替代原生 Claude 的体验只能用一个词形容——舒坦。账号不会被封、账单看得懂、能力跟得上、Skills 链路无缝。唯一让我难受的就是不收图这一件事,每次切回 Claude 都觉得是退回到了上一个时代。

这次识图模式灰度,不只是 DeepSeek 自己补一块拼图,对 Claude Code 用户来说,这是国产模型替换闭源 SOTA 的最后一道坎。两周后 API 开放、Anthropic 协议兼容层把 image 字段加上,Claude Code 接 DeepSeek 的工作流就真的没有缺角了。

如果你还在为 Claude 账号封禁的事焦虑、还在为多模态切来切去而烦躁——再忍两周。这条路走完,国产替换的故事,才算真正写完。

目录
相关文章
|
1天前
|
人工智能 JSON 供应链
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
LucianaiB分享零成本畅用JVS Claw教程(学生认证享7个月使用权),并开源GeoMind项目——将JVS改造为科研与产业地理情报可视化AI助手,支持飞书文档解析、地理编码与腾讯地图可视化,助力产业关系图谱构建。
23255 1
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
|
2天前
|
人工智能 API 开发工具
Claude Code国内安装:2026最新保姆教程(附cc-switch配置)
Claude Code是我目前最推荐的AI编程工具,没有之一。 它可能不是最简单的,但绝对是上限最高的。一旦跑通安装、接上模型、定好规范,你会发现很多原本需要几小时的工作,现在几分钟就能搞定。 这套方案的核心优势就三个字:可控性。你不用依赖任何不稳定服务,所有组件都在自己手里。模型效果不好?换一个。框架更新了?自己决定升不升。 这才是AI时代开发者该有的姿势——不是被动等喂饭,而是主动搭建自己的生产力基础设施。 希望这篇保姆教程,能帮你顺利上车。做出你自己的作品。
Claude Code国内安装:2026最新保姆教程(附cc-switch配置)
|
10天前
|
缓存 人工智能 自然语言处理
我对比了8个Claude API中转站,踩了不少坑,总结给你
本文是个人开发者耗时1周实测的8大Claude中转平台横向评测,聚焦Claude Code真实体验:以加权均价(¥/M token)、内部汇率、缓存支持、模型真实性及稳定性为核心指标。
4038 23
|
4天前
|
人工智能 缓存 BI
Claude Code + DeepSeek V4-Pro 真实评测:除了贵,没别的毛病
JeecgBoot AI专题研究 把 Claude Code 接入 DeepSeek V4Pro,跑完 Skills —— OA 审批、大屏、报表、部署 5 大实战场景后的真实体验 ![](https://oscimg.oschina.net/oscnet/up608d34aeb6bafc47f
2305 5
Claude Code + DeepSeek V4-Pro 真实评测:除了贵,没别的毛病
|
6天前
|
人工智能 JSON BI
DeepSeek V4 来了!超越 Claude Sonnet 4.5,赶紧对接 Claude Code 体验一把
JeecgBoot AI专题研究 把 Claude Code 接入 DeepSeek V4Pro 的真实体验与避坑记录 本文记录我将 Claude Code 对接 DeepSeek 最新模型(V4Pro)后的真实体验,测试了 Skills 自动化查询和积木报表 AI 建表两个场景——有惊喜,也踩
2733 8
|
22天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
本文介绍了Claude Code终端AI助手的使用指南,主要内容包括:1)常用命令如版本查看、项目启动和更新;2)三种工作模式切换及界面说明;3)核心功能指令速查表,包含初始化、压缩对话、清除历史等操作;4)详细解析了/init、/help、/clear、/compact、/memory等关键命令的使用场景和语法。文章通过丰富的界面截图和场景示例,帮助开发者快速掌握如何通过命令行和交互界面高效使用Claude Code进行项目开发,特别强调了CLAUDE.md文件作为项目知识库的核心作用。
19502 61
Claude Code 全攻略:命令大全 + 实战工作流(建议收藏)
|
3天前
|
SQL 人工智能 弹性计算
阿里云发布 Agentic NDR,威胁检测与响应进入智能体时代
欢迎前往阿里云云防火墙控制台体验!
1173 2