deepseek0528发布

简介: DeepSeek-R1-0528 是 DeepSeek 团队于 2025 年发布的 R1 推理大模型升级版,虽定位为“小版本试升级”,但表现远超预期。其在数学推理(AIME 测试准确率提升至 87.5%)、编程能力(接近 OpenAI o3 水平,可生成 1000+ 行无 bug 代码)、长文本处理(支持 128K tokens)及写作质量等方面均有显著提升。此外,新增 Function Calling 和 JSON 输出功能,便于开发者集成。用户可通过 Ollama 本地部署或访问 https://chat.deepseek.com/ 在线体验满血版。

DeepSeek-R1-0528 是 DeepSeek 团队于 2025 年 5 月 28 日发布的 R1 推理大模型升级版本,虽然官方将其定位为“小版本试升级”,但实测表现远超预期,在推理能力、编程性能、长文本处理和写作质量等方面均有显著提升。

image.png

DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528),地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main
image.png

核心升级亮点

屏幕截图 2025-05-30 162116.png

推理能力大幅提升

  • 在数学推理(如 AIME 2025 测试)中,准确率从旧版的 70% 提升至 87.5%,超越人类专业选手平均水平(75%)。
  • 支持 30-60 分钟的深度推理,适用于数学证明、逻辑链拆解等复杂任务。

编程能力跻身国际一线

  • 在 LiveCodeBench 测试中接近 OpenAI o3 水平,可一次性生成 1000+ 行无 bug 代码,支持动态交互、物理模拟等复杂功能。
  • 前端代码生成能力显著增强,可自动生成现代 UI 设计,参考后文中生成flappy bird网页游戏。

128K 超长上下文支持

  • 相比旧版,新版支持 128K tokens 上下文,显著提升长文档处理能力,减少“遗忘设定”问题。

幻觉率降低 & 写作更自然

  • 在改写、摘要、阅读理解等任务中,幻觉率降低 ​​45-50%​​,输出更可靠。
  • 创意写作(如小说、散文)更贴近人类风格,结构更完整。

工具调用 & JSON 输出

  • 新增 Function Calling 和 JSON 格式输出,便于 API 开发者集成。

目前主流模型能力对比

image.png

前端代码能力和体验增强

一键生成H5游戏

image.png

image.png

如何体验

ollama 本地部署蒸馏版

image.png

Ollama安装

  • 访问官网 ollama.com/download 下载Ollama安装包并安装到本机,网速慢的可以使用迅雷下载。
  • 安装完成后可以通过 ollama --version 查看版本号。

安装完成后搜索DeepSeek-R1-0528-Qwen3-8B,执行如下命令:

image.png

即可本地体验:

image.png

在线体验满血版

直接打开https://chat.deepseek.com/ 即可体验。
截至目前,百度千帆平台已经支持DeepSeek-R1-0528,可以通过千帆api可以体验满血版:

image.png

相关文章
|
4月前
|
人工智能 小程序 API
DeepSeek‑R1-0528 重磅升级:蚂蚁百宝箱免费、无限量调用
DeepSeek-R1-0528 版本重磅升级,推理能力显著增强,在数学、编程和通用逻辑等基准测评中表现卓越,媲美国际顶尖模型。此次更新提供免费、无限量调用通道——蚂蚁百宝箱,用户可通过简单五步构建智能体并发布至多端平台。模型基于 DeepSeek V3 Base,参数规模达 685B,上下文长度最高支持 128K,助力开发者快速嵌入顶尖推理能力,打造创新应用。立即访问蚂蚁百宝箱体验!
319 11
|
3月前
|
人工智能 自然语言处理 监控
|
10天前
|
存储 人工智能 API
Qoder 正式开放订阅,Credits 耐用度提升1/3
Qoder 自 2025 年 8 月 21 日公测以来,以最强的上下文工程能力以及 Repo Wiki、Quest Mode 等广受好评的产品功能,收获了全球开发者的支持和喜爱。今天,Qoder 面向全球用户正式推出付费订阅计划,助力开发者开启高效流畅的编程之旅。
|
3月前
|
人工智能 API 定位技术
MCP全方位扫盲
MCP(Model Context Protocol)是由Anthropic提出的协议,旨在标准化大模型与外部数据源和工具的通信方式。其核心架构包括MCP Client(客户端)和MCP Server(服务端),通过标准化接口实现解耦,支持不同LLM无缝调用工具。相比传统方法,MCP简化了Prompt工程,减少定制代码,提升复用性。实际场景中,如天气查询或支付处理,MCP可智能调用对应工具,优化用户体验。MCP的核心价值在于标准化通信、统一工具描述及动态兼容性,成为大模型与外部服务的智能桥梁。
|
3月前
|
机器学习/深度学习 存储 缓存
大模型推理显存和计算量估计方法
最近做吞吐量调试涉及到输入batch_size的设置,为了把算力和显存用起来,同时不触发out of memory,需要提前估计大模型推理过程中的显存占用
511 5
|
7月前
|
人工智能 Serverless API
评测|全网最强🚀!5min部署满血版DeepSeek,零成本,无需编程!
本文介绍了阿里云提供的四种DeepSeek部署方案,包括基于百炼调用满血版API、基于函数计算部署、基于人工智能平台PAI部署和GPU云服务器部署。通过这些方案,用户可以摆脱“服务器繁忙”的困扰,实现快速部署与使用
2230 3
评测|全网最强🚀!5min部署满血版DeepSeek,零成本,无需编程!
|
人工智能 大数据 开发者
阿里云技术解决方案开放免费试用,热门AI场景免费体验!
阿里云推出免费试用计划,2025年7月起,新老用户均可领取100点试用点,用于部署体验技术解决方案。完成部署还可再获最高100点,相当于一年200元云资源免费用。支持AI、大数据、安全等多个领域,涵盖DeepSeek部署、模型微调等热门场景。点击链接即可领取,快速上手云上方案。
|
应用服务中间件 Linux nginx
让 CentOS 定时重启 Nginx
在CentOS上设置Nginx定时重启可通过`cron`或`systemctl`
583 0
|
11月前
|
Linux Docker 容器
Centos安装docker(linux安装docker)——超详细小白可操作手把手教程,包好用!!!
本篇博客重在讲解Centos安装docker,经博主多次在不同服务器上测试,极其的稳定,尤其是阿里的服务器,一路复制命令畅通无阻。
18814 5
Centos安装docker(linux安装docker)——超详细小白可操作手把手教程,包好用!!!
|
11月前
|
Ubuntu 安全 Linux