阿里云AI Stack全量适配Qwen3模型,企业级部署效率全面升级

简介: 2025年4月29日的凌晨5点,阿里全新一代模型通义千问Qwen3正式发布并全部开源8款「混合推理模型」,包含:6款Dense模型:0.6B、1.7B、4B、8B、14B、32B。2款MoE模型:Qwen3-30B-A3B和旗舰版Qwen3-235B-A22B。阿里云AI Stack已适配全量Qwen3模型,可快速部署实现Qwen3模型的开箱即用!

师出同门,AI Stack原生适配Qwen3

阿里云AI Stack是面向企业级的轻量、极致性价比企业级AI软硬一体解决方案,此前已完成Qwen2.5等主流开源大模型的适配。AI Stack目前已与“师出同门”的Qwen3实现高效深度适配,通过AI Stack快速部署Qwen3,实现新一代大模型的“开箱即用”。

image.png

AI Stack单机提供16卡,1.5+TB超大显存,700GB/s卡间互联,满足业务的多样化需求:

  • 16卡可运行无损精度旗舰版Qwen3-235B-A22B,提供更快响应、更高并发、更长上下文支持,满足业务的快速响应需求。
  • 灵活满足业务多样性需求,单机16卡中的8卡可实现无损精度旗舰版Qwen3-235B-A22B的极速运行,剩余8卡可适配其他不同尺寸、不同模态模型,为更大尺寸模型部署留足算力空间。


即日起,最新版本AI stack将包含Qwen3全尺寸模型,并支持最新APG SDK。客户可通过新安装或现有版本升级的方式,获取最新Qwen3模型服务能力,将AI能力与业务场景融合,加速企业的数智化升级!

相关文章
|
7月前
|
机器学习/深度学习 人工智能 人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
624 121
|
7月前
|
人工智能 人机交互 知识图谱
当AI学会“融会贯通”:多模态大模型如何重塑未来
当AI学会“融会贯通”:多模态大模型如何重塑未来
434 114
|
7月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
993 120
|
7月前
|
人工智能 安全 搜索推荐
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
687 117
|
7月前
|
人工智能 机器人 人机交互
当AI学会“看、听、懂”:多模态技术的现在与未来
当AI学会“看、听、懂”:多模态技术的现在与未来
457 117
|
7月前
|
人工智能 API 开发工具
构建AI智能体:一、初识AI大模型与API调用
本文介绍大模型基础知识及API调用方法,涵盖阿里云百炼平台密钥申请、DashScope SDK使用、Python调用示例(如文本情感分析、图像文字识别),助力开发者快速上手大模型应用开发。
2660 18
构建AI智能体:一、初识AI大模型与API调用
|
7月前
|
人工智能 安全 开发工具
C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审
本文介绍基于Qwen3-Coder、RAG与Iflow在C3级代码仓库落地LLM代码评审的实践,实现AI辅助人工评审。通过CI流水线自动触发,结合私域知识库与生产代码同仓管理,已成功拦截数十次高危缺陷,显著提升评审效率与质量,具备向各类代码门禁平台复用推广的价值。(239字)
1399 24
|
7月前
|
缓存 物联网 PyTorch
使用TensorRT LLM构建和运行Qwen模型
本文档介绍如何在单GPU和单节点多GPU上使用TensorRT LLM构建和运行Qwen模型,涵盖模型转换、引擎构建、量化推理及LoRA微调等操作,并提供详细的代码示例与支持矩阵。
1902 2
|
7月前
|
人工智能 算法 数据安全/隐私保护
拔俗AI多模态心理风险预警系统:用科技守护心理健康的第一道防线
AI多模态心理风险预警系统通过语音、文本、表情与行为数据,智能识别抑郁、焦虑等心理风险,实现早期干预。融合多源信息,提升准确率,广泛应用于校园、企业,助力心理健康服务从“被动响应”转向“主动预防”,为心灵筑起智能防线。(238字)
815 0

热门文章

最新文章