DeepSeek-V3小版本升级,非推理模型王者归来

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 今天,DeepSeek低调地在魔搭社区开源 DeepSeek-V3-0324 模型,虽然官方低调称之为小版本升级,但能力提升一点也不小。

今天,DeepSeek低调地在魔搭社区开源 DeepSeek-V3-0324 模型,虽然官方低调称之为小版本升级,但能力提升一点也不小。

模型地址:

https://www.modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324

01.模型表现

DeepSeek-V3-0324 在多个关键方面展示了相较于其前代产品 DeepSeek-V3 的显著改进。

推理能力

  • 基准测试性能显著提升:
  • MMLU-Pro: 75.9 → 81.2 (+5.3)
  • GPQA: 59.1 → 68.4 (+9.3)
  • AIME: 39.6 → 59.4 (+19.8)
  • LiveCodeBench: 39.2 → 49.2 (+10.0)

前端网页开发

  • 提高了代码的可执行性
  • 更美观的网页和游戏前端

中文写作能力

  • 增强了风格和内容质量:
  • 符合 R1 写作风格
  • 在中长篇写作中的质量更高
  • 功能增强
  • 改进了多轮交互式重写
  • 优化了翻译质量和书信写作

中文搜索能力

  • 增强了报告分析请求,输出更详细

函数调用改进

  • 提高了函数调用的准确性,修复了 V3 之前版本的问题

02.使用建议

系统提示

在官方 DeepSeek 网站/应用程序中,使用带有特定日期的相同系统提示。

该助手为DeepSeek Chat,由深度求索公司创造。
今天是{current date}。

例如

该助手为DeepSeek Chat,由深度求索公司创造。
今天是3月24日,星期一。

温度设置

在deepseek的网页和应用环境中,温度参数被设置为 0.3。因为许多用户在 API 调用时使用默认的温度 1.0,所以DeepSeek实现了一个 API 温度 TapiT_{api}Tapi 映射机制,将输入的 API 温度值 1.0 调整为最适合模型的温度设置 0.3。

文件上传和网络搜索的提示

对于文件上传,请按照模板创建提示,其中 {file_name}, {file_content} 和 {question} 是参数。

file_template = \
"""[file name]: {file_name}
[file content begin]
{file_content}
[file content end]
{question}"""

对于网络搜索,{search_results}, {cur_date}, 和 {question} 是参数。

对于中文查询,使用的提示是:

对于英文查询,使用的提示是:


03.本地运行

使用SGLang进行推理(官方推荐)

SGLang目前支持MLA 优化、DP Attention、FP8(W8A8)、FP8 KV Cache 和 Torch Compile,在开源框架中提供最先进的延迟和吞吐量性能。

同时,SGLang v0.4.1完全支持在NVIDIA 和 AMD GPU上运行 DeepSeek-V3 ,使其成为一种高度通用且强大的解决方案。

SGLang 还支持多节点张量并行,能够在多台联网的机器上运行此模型。

推理代码:

# Installation
pip install "sglang[all]>=0.4.3" --find-links https://flashinfer.ai/whl/cu124/torch2.5/flashinfer-python
# Launch
python3 -m sglang.launch_server --model /Your_Model_Path/DeepSeek-V3-0324 --tp 8 --trust-remote-code

根据需要添加性能优化选项。

许可证

仓库及模型权重遵循 MIT License

欢迎点击链接跳转模型详情~

DeepSeek-V3-0324

目录
相关文章
|
29天前
|
人工智能 数据可视化 数据挖掘
QVQ-Max:阿里通义新一代视觉推理模型!再造多模态「全能眼」秒解图文难题
QVQ-Max是阿里通义推出的新一代视觉推理模型,不仅能解析图像视频内容,还能进行深度推理和创意生成,在数学解题、数据分析、穿搭建议等场景展现强大能力。
166 15
QVQ-Max:阿里通义新一代视觉推理模型!再造多模态「全能眼」秒解图文难题
|
1月前
|
机器学习/深度学习 人工智能 机器人
阿里通义开源推理模型新王者!QwQ-32B:性能直逼671B的DeepSeek-R1
QwQ-32B 是阿里巴巴开源的新型推理模型,基于强化学习训练,具备强大的数学推理和编程能力,性能媲美更大参数量的模型。
513 8
阿里通义开源推理模型新王者!QwQ-32B:性能直逼671B的DeepSeek-R1
|
2月前
|
人工智能 开发者
首发!阶跃星辰最新开源多模态模型上线阿里云魔搭
首发!阶跃星辰最新开源多模态模型上线阿里云魔搭
197 10
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
创造历史!DeepSeek超越ChatGPT登顶中美AppStore
创造历史!DeepSeek超越ChatGPT登顶中美AppStore
|
1月前
|
机器学习/深度学习 人工智能 内存技术
AI界重磅炸弹:“50美元”复现DeepSeek R1?
AI界重磅炸弹:“50美元”复现DeepSeek R1?
|
2月前
|
人工智能 Java 程序员
一文彻底拿下,赶紧本地部署DeepSeek体验一下最牛的大模型
本文介绍如何本地化部署DeepSeek大模型(deepseek-r1)及open-webui的安装过程,包括命令行操作、版本兼容性处理等详细步骤。DeepSeek号称“国运级”大模型,性能媲美OpenAI,支持直接对话,降低使用门槛。通过本教程,读者可以快速上手体验这一强大的推理模型。
194 0
一文彻底拿下,赶紧本地部署DeepSeek体验一下最牛的大模型
|
1月前
|
人工智能 JavaScript Python
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
|
6月前
|
前端开发 算法 测试技术
前端大模型应用笔记(五):大模型基础能力大比拼-计数篇-通义千文 vs 文心一言 vs 智谱 vs 讯飞vsGPT
本文对比测试了通义千文、文心一言、智谱和讯飞等多个国产大模型在处理基础计数问题上的表现,特别是通过链式推理(COT)提示的效果。结果显示,GPTo1-mini、文心一言3.5和讯飞4.0Ultra在首轮测试中表现优秀,而其他模型在COT提示后也能显著提升正确率,唯有讯飞4.0-Lite表现不佳。测试强调了COT在提升模型逻辑推理能力中的重要性,并指出免费版本中智谱GLM较为可靠。
229 0
前端大模型应用笔记(五):大模型基础能力大比拼-计数篇-通义千文 vs 文心一言 vs 智谱 vs 讯飞vsGPT
|
9月前
|
人工智能 自然语言处理 物联网
开源最新 Llama 3.1 系列大模型抢先体验
Meta开源Llama 3.1系列模型,含4050亿参数“超大杯”版本。阿里云百炼率先上架全系列,并为新老用户享30天100万tokens免费算力。模型广场现开放体验,欢迎试用与反馈。涵盖80亿、700亿、4050亿参数版本,上下文长度最大可达128K tokens,支持多语言。立即体验Llama 3.1的强大能力!

热门文章

最新文章

下一篇
oss创建bucket