本月月刊是2024年的末尾刊,时间过得真快啊🤗,在这祝大家新年快乐呀!🔶在这个寒冷的季节里,我们的热情不减,持续为您带来最新的技术革新和服务升级。本月,我们不仅上线了一大批的模型,还增强了智能体应用的功能,以确保您在百炼的每一次交互都能更加高效和精准。通过不断倾听来自社区的声音以及内部团队的努力探索,我们在性能提升、用户体验改善及安全保障方面取得了显著成果。希望这些改进能够帮助每一位使用者更好地应对工作中的难题,激发无限创意。让我们一起迎接新的一年,携手共创更加辉煌的成绩!
🤩本月重点highlight
- 通义千问VL图片理解大模型部分规格降价,qwen-vl-plus模型输入降价81.3%,输出降价43.8%。qwen-vl-max模型输入降价85%,输出降价55.0%。
- 新上线了较多模型:如专注于提升视觉推理的qvq-72b-preview模型,多语言文本统一排序gte-rerank模型,人物视频生成videoretalk模型等新能力模型,也上线了plus的快照等新模型。
- 本月在应用模块也迭代了较多新功能。支持音视频互动,开启互联网搜索,支持意图选择等,极大的丰富了应用能力。
- 新增了Context Cache 功能以及支持batch调用的模型,提升了模型的响应速度,减少了费用。
1. 😊产品功能更新
1.1模型服务
- 通义千问VL大模型部分规格下调了推理调用费用:qwen-vl-plus模型输入降价81.3%,输出降价43.8%。qwen-vl-max模型输入降价85%,输出降价55.0%。详情请参见通义千问VL系列模型降价通知
- 语音合成CosyVoice大模型支持声音复刻:用户仅需提供10~20秒的音频,即可迅速生成高度相似且听感自然的定制声音。详情请参见声音复刻。
- 通义千问API调用模型新增search_options参数:配置联网搜索相关的参数,如搜索来源、搜索数量等。可用于qwen-max、qwen-plus、qwen-turbo模型,使用方法请参见通义千问API文档-DashScope。
- 新增通义千问2.5-7B支持 SFT 调优:通义千问2.5-7B支持 SFT 全参和高效调优。详情请参考模型调优
- 模型部署支持按调用量计费:按调用量计费的方式支持部署 qwen2.5-7B、14B、32B、72B 和 qwen2-7B 调优后的模型。详情请参考模型部署
- 新增 Context Cache 功能:Context Cache 技术通过缓存不同推理请求中的公共前缀内容,减少重复计算的需求,从而在保持回复质量的同时,提高了响应速度并降低了使用成本。这项技术特别适用于多轮对话或针对同一主题(如一本书)的多次查询等场景。当前仅支持qwen-plus模型。详情请参考Context Cache(上下文缓存)
- batch支持任务通知:Batch支持任务完成之后通知,减少不必要的任务查询,提高效率。详情参见Batch。
- 新增支持batch调用的模型:qwen-long、qwen-vl-max、qwen-vl-plus、qwq-32b-preview支持batch调用,Batch调用的费用为实时调用的50%。详情参见Batch。
1.2应用服务
- 应用支持互联网搜索:开启后,同时调用互联网搜索和知识库回答用户query,由大模型进行生成结果。
- 应用支持音视频交互:智能体应用和工作流应用支持音视频实时互动,提供了便捷的调试窗口。视频交互当前仅支持VL模型体验,详情请参考智能体应用。
- 工作流画布功能优化:意图分类节点支持选择意图模式:单选模式和多选模式,文本转换节点支持JSON格式输出。详情请参考工作流应用。
- 智能体编排应用支持条件判断节点:支持在节点内部对参数进行条件判断,然后通过不同分支的文本转换节点生成输出回复。详情请参考智能体编排应用。
1.3系统服务
- ram账号拥有百炼的管理员,可以查看已授权业务空间内全部的调用统计信息。详情请参见调用统计。
2. 😗模型更新迭代
1️⃣新增视觉推理模型:新增qvq-72b-preview模型,专注于提升视觉推理能力,尤其在数学推理领域。使用方法请参见视觉理解。当前仅支持API调用,模型广场还未开通体验入口。
qvq-72b-preview模型规格:
2️⃣新增qwen-plus快照模型:新增qwen-plus-2024-12-20快照模型,相对于通义千问-Plus-1125版本,中英文整体能力有提升,中英常识知识类、阅读理解能力提升较为显著,codeswtich现象相比上一版有显著改善,中文指令遵循能力显著提升。详情请参见:使用说明
qwen-plus-2024-12-20模型规格:
3️⃣新增qwen2-vl-72b-instruct模型:qwen2-vl-72b-instruc在多个视觉理解基准测试中取得了最先进的成绩,显著增强多模态任务的处理能力,免费体验中。详情请参见视觉理解。
qwen2-vl-72b-instruc模型规格:
4️⃣新增多语言翻译模型:qwen-mt-turbo&qwen-mt-plus翻译模型已上线,擅长中英互译、中文与小语种互译、英文与小语种互译,小语种包括日、韩、法、西、德、葡(巴西)、泰、印尼、越、阿等26种。详情请参见使用说明。
qwen-mt-turbo&qwen-mt-plus模型规格:
5️⃣新增gte-rerank模型:是多语言文本统一排序模型,通常用于语义检索、RAG等场景,可以简单、有效地提升文本检索的效果,目前正在限时免费中。点击🔗快速开始进行体验。
gte-rerank模型规格:
6️⃣新增意图分类模型:tongyi-intent-detect-v3意图模型已上线,可实现基于 API的意图和槽位参数联合预测,详情请参见使用说明。
tongyi-intent-detect-v3模型规格:
7️⃣新增语音模型:新增qwen-audio-turbo-latest、qwen-audio-turbo-2024-12-04模型,相较于qwen-audio-turbo-2024-08-07版本,大幅提升语音识别准确率,并新增了语音聊天能力。详情请参见音频理解。
qwen-audio-turbo-latest、qwen-audio-turbo-2024-12-04模型规格:
8️⃣新增videoretalk模型:声动人像VideoRetalk是一个人物视频生成模型,支持根据人物视频和音频生成对口型视频。详情请参见快速开始。
VideoRetalk模型单价:
3. 😲阿里云百炼大模型服务平台12月产品Relase Note
功能所属模块 |
功能主要描述 |
模型上线 |
|
模型服务 |
|
应用管理 |
|
系统管理 |
|
🚀需要了解阿里云百炼可点击以下链接:
👉阿里云百炼详情了解可点击此官网链接:阿里云百炼官网介绍
👉阿里云百炼控制台页面可点击此链接直接进入:阿里云百炼控制台
欢迎大家在评论区交流探讨调用百炼新能力的体验与经验 。如果您在体验过程中有遇到什么问题需要我们解答,可以在评论区中留言探讨或是加入我们的官方支持群(群号:77600022533)进行交流反馈!