3月,阿里云百炼平台在模型与应用上实现突破,推出全新各类模型,助力开发者快速构建AI应用。新增对多模态模型的支持,优化了视觉、语音和文本处理能力,满足复杂场景需求。同时,阿里云百炼加强了对大模型应用的性能优化,显著降低计算成本。阿里云百炼致力于打造更易用、高效的大模型服务平台,赋能企业数字化升级与业务增长。
🌝本月重点highlight
- 新增了多模态理解生成模型qwen2.5-omni-7b,视觉推理qvq-max系列模型,支持视觉输入及思维链输出。发布了开源推理模型qwq-32b,该模型参数量达320亿,推出了基于Qwen2.5的推理模型qwq-plus系列,进一步提升了自然语言处理、多模态任务和代码生成的表现。
- 推出了语音识别/翻译模型gummy-realtime-v1和gummy-chat-v1,能够精准识别并翻译多种语言,适用于会议演讲、视频直播、对话聊天等场景。
- 为了更好地支持智能体应用,阿里云百炼智能体应用引入了qwen-vl-plus-latest等模型,增强了文本和图像处理能力,提高了交互性和自动化水平。
- aitryon模型价格下调,降至0.2元每张。降低了使用门槛和成本。
1. 产品功能更新
- 新增插件:周边查询插件。该插件提供友好的周边位置信息查询服务,包括出行和生活服务相关的POI/路线/时间等查询能力。提供30次免费调用次数,有效期是免费使用开通后30天内。入口链接:周边查询插件
- 智能体应用支持qwen-vl-plus-latest、qwen-vl-plus-2025-01-25模型。
- 阿里云百炼/析言公布了一种基于MCP的析言服务,助力agentic和各类manus应用,让LLM以自然语言的方式访问数据库,目前支持远程和本地数据库,各类模型以及xiyansql-qwencoder模型。具体可参考:xiyan_mcp_服务器
2. 模型服务更新
2.1新上架模型
新增视觉推理模型:qvq-max、qvq-max-latest、qvq-max-2025-03-25,支持视觉输入及思维链输出,在数学、编程、视觉分析、创作以及通用任务上都表现出更强的能力。使用方法请参见:视觉推理(QVQ)
qvq-max、qvq-max-latest、qvq-max-2025-03-25模型规格:
模型名称 |
版本 |
上下文长度 |
最大输入 |
最大思维链长度 |
最大回复长度 |
输入成本 |
输出成本 |
免费额度 |
(Token数) |
(每千Token) |
|||||||
qvq-max 当前等同 qvq-max-2025-03-25 |
稳定版 |
122,880 |
98,304 单图最大16384 |
16,384 |
8,192 |
0.008元 |
0.032元 |
各100万 Token 有效期:阿里云百炼开通后180天内 |
qvq-max-latest 始终等同最新快照版 |
最新版 |
|||||||
qvq-max-2025-03-25 又称qvq-max-0325 |
快照版 |
新增多模态理解生成模型:qwen2.5-omni-7b,基于Qwen2.5训练的全新多模态理解生成大模型,支持文本、图像、语音、视频输入理解,具备文本和语音同时流式生成的能力,多模态内容理解速度显著提升。使用方法请参见:Qwen-Omni 模型
qwen2.5-omni-7b模型规格:
模型名称 |
上下文长度 |
最大输入 |
最大输出 |
免费额度 |
(Token数) |
||||
qwen2.5-omni-7b |
32,768 |
30,720 |
2,048 |
100万Token(不区分模态) 有效期:阿里云百炼开通后180天内 |
新增图像编辑模型:wanx2.1-imageedit,通过一句话指令实现多样化的图像编辑功能,如扩图、去文字水印、图像修复、图像风格迁移等。使用方法请参见:通用图像编辑API参考
wanx2.1-imageedit模型规格:
模型名称 |
计费单价 |
免费额度 |
wanx2.1-imageedit |
0.14元/张 |
免费额度:500张 有效期:阿里云百炼开通后180天内 |
新增开源推理模型:qwq-32b,基于 Qwen2.5-32B 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平,各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。使用方法请参见:深度思考(QwQ)
qwq-32b模型规格:
模型名称 |
上下文长度 |
最大输入 |
最大思维链长度 |
最大回复长度 |
输入成本 |
输出成本 |
免费额度 |
(Token数) |
(每千Token) |
||||||
qwq-32b |
131,072 |
98,304 |
32,768 |
8,192 |
0.002元 |
0.006元 |
100万 Token 有效期:阿里云百炼开通后180天内 |
新增推理模型:qwq-plus、qwq-plus-latest、qwq-plus-2025-03-05,基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平。使用方法请参见:深度思考(QwQ)
qwq-plus、qwq-plus-latest、qwq-plus-2025-03-05模型规格:
新增语音识别/翻译模型:gummy-realtime-v1,gummy-chat-v1,Gummy大模型支持实时语音识别与翻译,能够精准识别中、英、日、韩等10种语言。此外,它还支持中、英、日、韩之间的互译,以及其他6种语言单向翻译成中文或英文。使用方法请参见:语音识别/翻译
gummy-realtime-v1,gummy-chat-v1模型规格:
模型名称 |
支持的语言 |
支持的采样率 |
适用场景 |
支持的音频格式 |
单价 |
免费额度 |
gummy-realtime-v1 |
中文、英文、日语、韩语、粤语、德语、法语、俄语、意大利语、西班牙语 翻译语言对: 中 → 英/日/韩 英 → 中/日/韩 日/韩/粤/德/法/俄/意/西 → 中/英 |
16kHz及以上 |
会议演讲、视频直播等长时间不间断识别的场景 |
pcm、wav、mp3、opus、speex、aac、amr |
0.00015元/秒 |
36,000秒(10小时) 2025年1月17日0点前开通百炼:有效期至2025年7月15日 2025年1月17日0点后开通百炼:自开通日起180天有效 |
gummy-chat-v1 |
16kHz |
对话聊天、指令控制、语音输入法、语音搜索等短时语音交互场景 |
新增qwen2.5-VL-32B模型,在math和学科问题解答达到了接近Qwen2.5VL-72B的水平,回复风格面向人类偏好进行大幅调整,尤其是数学、逻辑推理、知识问答等客观类query,模型回复详实程度和格式清晰度明显改善。使用方法请参见:通义千问api参考
qwen2.5-VL-32B模型规格:
模型名称 |
上下文长度 |
最大输入 |
最大输出 |
输入成本 |
输出成本 |
免费额度 |
(Token数) |
(每千Token) |
|||||
qwen2.5-vl-32b-instruct |
131,072 |
129,024 单图最大16384 |
8,192 |
0.008元 |
0.024元 |
各100万Token 有效期:阿里云百炼开通后180天内 |
2.2模型迭代
- 通用文本向量-v3模型新增512/256/128/64等低纬度支持,提升了效率,优化存储空间。具体可参考:调用方式
- 通义千问VL视频理解功能支持qwen2.5-vl-72b-instruct、qwen-vl-max-2025-01-25、qwen-vl-max-latest、qwen-vl-max-1119、qwen-vl-max模型直接调用,无需提交工单申请。具体可参考:调用方式
2.3模型商业化
- qwen-max采购季资源包上线,折扣力度:8折,优惠时间:2025年03月06日14:00:00~2025年04月01日00:00:00。活动结束后,资源包优惠下线,恢复原价。详情请参见:阿里云百炼采购季优惠资源包
- aitryon模型价格下调,由原来的0.6元每张下降至0.2元每张。调用方式请参见:AI试衣API详情
3. 阿里云百炼大模型服务平台3月产品Relase Note
功能所属模块 |
功能主要描述 |
模型上线 |
|
模型服务 |
|
应用管理 |
|
🚀需要了解阿里云百炼可点击以下链接:
👉阿里云百炼详情了解可点击此官网链接:阿里云百炼官网介绍
👉阿里云百炼控制台页面可点击此链接直接进入:阿里云百炼控制台
欢迎大家在评论区交流探讨调用阿里云百炼新能力的体验与经验 。如果您在体验过程中有遇到什么问题需要我们解答,可以在评论区中留言探讨或是加入我们的官方支持群(群号:77600022533)进行交流反馈!