DeepSeek 近期推出了“DeepSeek-V3-0324”版本,据测试在数学推理和前端开发方面的表现已优于 Claude 3.5 和 Claude 3.7 Sonnet。
阿里也推出了多模态大模型 Qwen2.5-VL 的新版本--“Qwen2.5-VL-32B-Instruct”,32B参数量实现72B级性能,通杀图文问答/视觉推理场景,解决了「72B 对 VLM 来说太大」和「7B 不够强大」的问题,可能是多模态 AI Agent 部署实践中的最佳选择。
阿里云 PAI-Model Gallery 已同步接入两大新模型,提供企业级部署方案:
- 零代码一键部署
- 自动适配云资源
- 开箱即用API
- 全流程运维托管
01
一、云上零门槛部署方案
立即体验
PAI-Model Gallery模型直达:
当前已支持多种部署方式,例如 DeepSeek-V3-0324 已支持 SGLang、vLLM 高性能部署框架,并可灵活选择单机/分布式部署方式。
二、后续将推出独家蒸馏版小模型
本次DeepSeek官方并没有放出蒸馏版小模型,由于671B模型的参数量太大,推理成本较高,为了方便用户可以低成本使用V3-0324模型的新能力,PAI-Model Gallery 后续将推出独家蒸馏版小模型,敬请关注!
三、PAI-Model Gallery 简介
Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。