deepseek0528发布

简介: DeepSeek-R1-0528 是 DeepSeek 团队于 2025 年发布的 R1 推理大模型升级版,虽定位为“小版本试升级”,但表现远超预期。其在数学推理(AIME 测试准确率提升至 87.5%)、编程能力(接近 OpenAI o3 水平,可生成 1000+ 行无 bug 代码)、长文本处理(支持 128K tokens)及写作质量等方面均有显著提升。此外,新增 Function Calling 和 JSON 输出功能,便于开发者集成。用户可通过 Ollama 本地部署或访问 https://chat.deepseek.com/ 在线体验满血版。

DeepSeek-R1-0528 是 DeepSeek 团队于 2025 年 5 月 28 日发布的 R1 推理大模型升级版本,虽然官方将其定位为“小版本试升级”,但实测表现远超预期,在推理能力、编程性能、长文本处理和写作质量等方面均有显著提升。

image.png

DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528),地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main
image.png

核心升级亮点

屏幕截图 2025-05-30 162116.png

推理能力大幅提升

  • 在数学推理(如 AIME 2025 测试)中,准确率从旧版的 70% 提升至 87.5%,超越人类专业选手平均水平(75%)。
  • 支持 30-60 分钟的深度推理,适用于数学证明、逻辑链拆解等复杂任务。

编程能力跻身国际一线

  • 在 LiveCodeBench 测试中接近 OpenAI o3 水平,可一次性生成 1000+ 行无 bug 代码,支持动态交互、物理模拟等复杂功能。
  • 前端代码生成能力显著增强,可自动生成现代 UI 设计,参考后文中生成flappy bird网页游戏。

128K 超长上下文支持

  • 相比旧版,新版支持 128K tokens 上下文,显著提升长文档处理能力,减少“遗忘设定”问题。

幻觉率降低 & 写作更自然

  • 在改写、摘要、阅读理解等任务中,幻觉率降低 ​​45-50%​​,输出更可靠。
  • 创意写作(如小说、散文)更贴近人类风格,结构更完整。

工具调用 & JSON 输出

  • 新增 Function Calling 和 JSON 格式输出,便于 API 开发者集成。

目前主流模型能力对比

image.png

前端代码能力和体验增强

一键生成H5游戏

image.png

image.png

如何体验

ollama 本地部署蒸馏版

image.png

Ollama安装

  • 访问官网 ollama.com/download 下载Ollama安装包并安装到本机,网速慢的可以使用迅雷下载。
  • 安装完成后可以通过 ollama --version 查看版本号。

安装完成后搜索DeepSeek-R1-0528-Qwen3-8B,执行如下命令:

image.png

即可本地体验:

image.png

在线体验满血版

直接打开https://chat.deepseek.com/ 即可体验。
截至目前,百度千帆平台已经支持DeepSeek-R1-0528,可以通过千帆api可以体验满血版:

image.png

相关文章
|
22天前
|
人工智能 API 定位技术
MCP全方位扫盲
MCP(Model Context Protocol)是由Anthropic提出的协议,旨在标准化大模型与外部数据源和工具的通信方式。其核心架构包括MCP Client(客户端)和MCP Server(服务端),通过标准化接口实现解耦,支持不同LLM无缝调用工具。相比传统方法,MCP简化了Prompt工程,减少定制代码,提升复用性。实际场景中,如天气查询或支付处理,MCP可智能调用对应工具,优化用户体验。MCP的核心价值在于标准化通信、统一工具描述及动态兼容性,成为大模型与外部服务的智能桥梁。
|
5月前
|
人工智能 Serverless API
评测|全网最强🚀!5min部署满血版DeepSeek,零成本,无需编程!
本文介绍了阿里云提供的四种DeepSeek部署方案,包括基于百炼调用满血版API、基于函数计算部署、基于人工智能平台PAI部署和GPU云服务器部署。通过这些方案,用户可以摆脱“服务器繁忙”的困扰,实现快速部署与使用
1802 3
评测|全网最强🚀!5min部署满血版DeepSeek,零成本,无需编程!
|
22天前
|
人工智能 自然语言处理 监控
|
开发工具 git
Git - No such remote ‘origin‘(git remote set-url origin ‘xxx.git‘)
Git - No such remote ‘origin‘(git remote set-url origin ‘xxx.git‘)
809 0
|
网络协议 测试技术 Go
客户管理系统-主菜单和退出|学习笔记
快速学习客户管理系统-主菜单和退出
客户管理系统-主菜单和退出|学习笔记
|
应用服务中间件 Linux nginx
让 CentOS 定时重启 Nginx
在CentOS上设置Nginx定时重启可通过`cron`或`systemctl`
507 0
|
机器学习/深度学习 数据采集 人工智能
【技术揭秘】高性能粤语语音识别模型构建方案
随着人工智能技术的飞速发展,语音识别(Automatic SpeechRecognition)的应用越来越广泛,对于多语种多口音语音识别的需求也在日渐增加。虽然语音识别系统的基本原理和框架是不受限于语种的,在建立一个新语种的ASR模型时,还是需要结合到语言本身的特点,才能得到较好的效果。
【技术揭秘】高性能粤语语音识别模型构建方案
|
存储 算法
数据结构—栈与队列【顺序存储、链式存储、卡特兰数、优先级队列】(四)
数据结构—栈与队列【顺序存储、链式存储、卡特兰数、优先级队列】
216 0
数据结构—栈与队列【顺序存储、链式存储、卡特兰数、优先级队列】(四)