DeepSeek-Chat模型升级为 DeepSeek-V3-0324:
推理能力增强
基准测试提升显著
MMLU-Pro: 75.9 → 81.2 (+5.3)
GPQA: 59.1 → 68.4 (+9.3)
AIME: 39.6 → 59.4 (+19.8)
LiveCodeBench: 39.2 → 49.2 (+10.0)
Web前端开发能力优化
代码生成准确率提升
生成的网页与游戏前端更加美观
中文写作能力升级
风格与内容优化
实现与R1写作风格对齐
中长篇写作内容质量提升
功能增强
多轮交互式改写能力提升
翻译质量与书信写作优化
中文搜索能力优化
报告分析类请求优化,输出内容详实
Function Calling 能力改进
Function Calling 准确率提升,修复 V3 之前的问题