月刊banner2.jpg

本月月刊是2024年的末尾刊，时间过得真快啊🤗，在这祝大家新年快乐呀！🔶在这个寒冷的季节里，我们的热情不减，持续为您带来最新的技术革新和服务升级。本月，我们不仅上线了一大批的模型，还增强了智能体应用的功能，以确保您在阿里云百炼的每一次交互都能更加高效和精准。通过不断倾听来自社区的声音以及内部团队的努力探索，我们在性能提升、用户体验改善及安全保障方面取得了显著成果。希望这些改进能够帮助每一位使用者更好地应对工作中的难题，激发无限创意。让我们一起迎接新的一年，携手共创更加辉煌的成绩！

1. 🤩本月重点highlight

通义千问VL图片理解大模型部分规格降价，qwen-vl-plus模型输入降价81.3%，输出降价43.8%。qwen-vl-max模型输入降价85%，输出降价55.0%。
新上线了较多模型：如专注于提升视觉推理的qvq-72b-preview模型，多语言文本统一排序gte-rerank模型，人物视频生成videoretalk模型等新能力模型，也上线了plus的快照等新模型。
本月在应用模块也迭代了较多新功能。支持音视频互动，开启互联网搜索，支持意图选择等，极大的丰富了应用能力。
新增了Context Cache 功能以及支持batch调用的模型，提升了模型的响应速度，减少了费用。

2. 😊产品功能更新

2.1 模型服务

通义千问VL大模型部分规格下调了推理调用费用：qwen-vl-plus模型输入降价81.3%，输出降价43.8%。qwen-vl-max模型输入降价85%，输出降价55.0%。详情请参见通义千问VL系列模型降价通知
语音合成CosyVoice大模型支持声音复刻：用户仅需提供10~20秒的音频，即可迅速生成高度相似且听感自然的定制声音。详情请参见声音复刻。
通义千问API调用模型新增search_options参数：配置联网搜索相关的参数，如搜索来源、搜索数量等。可用于qwen-max、qwen-plus、qwen-turbo模型，使用方法请参见通义千问API文档-DashScope。

新增通义千问2.5-7B支持 SFT 调优：通义千问2.5-7B支持 SFT 全参和高效调优。详情请参考模型调优

模型部署支持按调用量计费：按调用量计费的方式支持部署 qwen2.5-7B、14B、32B、72B 和 qwen2-7B 调优后的模型。详情请参考模型部署
新增 Context Cache 功能：Context Cache 技术通过缓存不同推理请求中的公共前缀内容，减少重复计算的需求，从而在保持回复质量的同时，提高了响应速度并降低了使用成本。这项技术特别适用于多轮对话或针对同一主题（如一本书）的多次查询等场景。当前仅支持qwen-plus模型。详情请参考Context Cache(上下文缓存)
batch支持任务通知：Batch支持任务完成之后通知，减少不必要的任务查询，提高效率。详情参见Batch。
新增支持batch调用的模型：qwen-long、qwen-vl-max、qwen-vl-plus、qwq-32b-preview支持batch调用，Batch调用的费用为实时调用的50%。详情参见Batch。

2.2 应用服务

应用支持互联网搜索：开启后，同时调用互联网搜索和知识库回答用户query，由大模型进行生成结果。

应用支持音视频交互：智能体应用和工作流应用支持音视频实时互动，提供了便捷的调试窗口。视频交互当前仅支持VL模型体验，详情请参考智能体应用。

工作流画布功能优化：意图分类节点支持选择意图模式：单选模式和多选模式，文本转换节点支持JSON格式输出。详情请参考工作流应用。

智能体编排应用支持条件判断节点：支持在节点内部对参数进行条件判断，然后通过不同分支的文本转换节点生成输出回复。详情请参考智能体编排应用。

3.3系统服务

ram账号拥有阿里云百炼的管理员，可以查看已授权业务空间内全部的调用统计信息。详情请参见调用统计。

3 . 😗模型更新迭代

1.新增视觉推理模型：新增qvq-72b-preview模型，专注于提升视觉推理能力，尤其在数学推理领域。使用方法请参见视觉理解。当前仅支持API调用，模型广场还未开通体验入口。

qvq-72b-preview模型规格：

2.新增qwen-plus快照模型：新增qwen-plus-2024-12-20快照模型，相对于通义千问-Plus-1125版本，中英文整体能力有提升，中英常识知识类、阅读理解能力提升较为显著，codeswtich现象相比上一版有显著改善，中文指令遵循能力显著提升。详情请参见：使用说明

qwen-plus-2024-12-20模型规格：

3.新增qwen2-vl-72b-instruct模型：qwen2-vl-72b-instruc在多个视觉理解基准测试中取得了最先进的成绩，显著增强多模态任务的处理能力，免费体验中。详情请参见视觉理解。

qwen2-vl-72b-instruc模型规格：

4.新增多语言翻译模型：qwen-mt-turbo&qwen-mt-plus翻译模型已上线，擅长中英互译、中文与小语种互译、英文与小语种互译，小语种包括日、韩、法、西、德、葡（巴西）、泰、印尼、越、阿等26种。详情请参见使用说明。

qwen-mt-turbo&qwen-mt-plus模型规格：

5.新增gte-rerank模型：是多语言文本统一排序模型，通常用于语义检索、RAG等场景，可以简单、有效地提升文本检索的效果，目前正在限时免费中。点击🔗快速开始进行体验。

gte-rerank模型规格：

6.新增意图分类模型：tongyi-intent-detect-v3意图模型已上线，可实现基于 API的意图和槽位参数联合预测，详情请参见使用说明。

tongyi-intent-detect-v3模型规格：

7.新增语音模型：新增qwen-audio-turbo-latest、qwen-audio-turbo-2024-12-04模型，相较于qwen-audio-turbo-2024-08-07版本，大幅提升语音识别准确率，并新增了语音聊天能力。详情请参见音频理解。

qwen-audio-turbo-latest、qwen-audio-turbo-2024-12-04模型规格：

8.新增videoretalk模型：声动人像VideoRetalk是一个人物视频生成模型，支持根据人物视频和音频生成对口型视频。详情请参见快速开始。

VideoRetalk模型单价：

4. 😲阿里云百炼大模型服务平台12月产品Relase Note

功能所属模块	功能主要描述
模型上线	新增qvq-72b-preview模型：它有卓越的视觉理解和复杂问题解决能力，能够像物理学家一样冷静应对复杂的物理问题，并通过逻辑推理找到解决方案。有效缩小与领先模型间的差距。新增qwen-plus-2024-12-20快照模型：通过大量的高质量数据训练而成，不仅在中文领域表现出色，在多语言支持上也达到了新的高度，极大地增强了跨文化交流的能力，阅读理解能力显著增强。新增qwen2-vl-72b-instruct模型：qwen2-vl-72b-instruc拥有720亿个参数，能够处理更加复杂和多样化的任务，除支持中英文外，还增加了对27种其他语言的支持，扩展了模型的应用范围。新增多语言翻译模型：Qwen-mt-turbo专注于提供快速且准确的翻译服务，特别适合需要即时响应的场景，如在线交流、即时消息等。Qwen-mt-plus则更侧重于专业领域文本的精确翻译，比如法律文件、技术文档等复杂内容，能够更好地理解上下文语境，提供更加流畅自然的语言转换。新增gte-rerank模型：是多语言文本统一排序模型，结合了全局文本嵌入（GTE）与重排序技术，显著提升了信息检索和推荐系统的性能。新增意图分类模型：一款高效能的自然语言处理工具，专门用于准确理解用户文本背后的真正意图。该模型基于大规模预训练技术，结合了深度学习与迁移学习的优势，能够从海量数据中提炼出丰富的语义信息。适用于建智能客服、推荐系统等应用场景新增qwen-audio-turbo-latest、qwen-audio-turbo-2024-12-04模型：在语音识别准确性、多语言支持、实时转录速度及背景噪音过滤方面表现出色，能够有效提升会议记录、在线教育、内容创作等场景下的用户体验。新增videoretalk模型：能够实现高质量的视频人像编辑，包括面部表情、头部姿态和口型同步等复杂任务，使得生成的内容自然流畅。可以应用于不同场景下的多种视频类型，还支持实时交互式编辑。
模型服务	通义千问VL大模型部分规格下调了推理调用费用：qwen-vl-plus模型输入降价81.3%，输出降价43.8%。qwen-vl-max模型输入降价85%，输出降价55.0%。降低了用户使用该模型的成本。能够以更低的预算享受到高质量的多模态理解和生成能力，包括但不限于图像理解、图文对话等。语音合成CosyVoice大模型支持声音复刻：仅需10-20秒的音频样本即可完成声音复刻，支持中文、英语等多种语言的语音合成，以及跨语言语音合成，支持流式推理模式，实现实时语音合成，适合需要即时响应的应用场景。通义千问API调用模型新增search_options参数：配置联网搜索相关的参数，如搜索来源、搜索数量等。可用于qwen-max、qwen-plus、qwen-turbo模型。新增通义千问2.5-7B支持 SFT 调优：针对性的微调，模型能够更好地理解特定领域或行业的术语和上下文，SFT调优允许根据用户的具体需求定制模型表现，无论是调整语气风格还是增强某些特定功能。模型部署支持按调用量计费：只需为实际使用的模型调用次数付费，无需预付费用，有效降低成本。按需付费模式使得用户可以根据业务需求灵活调整模型使用量，避免资源浪费。新增 Context Cache 功能：通过缓存重复性输入的大量数据，对于公共上下文仅收取一次费用，最高可节省90%的成本。显著提升了模型的响应速度。 batch支持任务通知：减少不必要的任务查询，提高效率。新增支持batch调用的模型：qwen-long、qwen-vl-max、qwen-vl-plus、qwq-32b-preview支持batch调用，Batch调用的费用为实时调用的50%。
应用管理	应用中支持开启互联网搜索：能够极大地扩展信息获取的范围，可以访问到整个互联网上海量的信息资源，提高信息查找的效率和准确性。应用支持音视频交互：提供了更加直观、生动的交流方式，可以实现即时反馈，对于需要快速响应的服务（如紧急救援）来说至关重要。意图分类节点支持选择意图模式：单选模式和多选模式文本转换节点支持JSON格式输出
系统管理	ram账号拥有百炼的管理员，可以查看已授权业务空间内全部的调用统计信息。

🚀需要了解阿里云百炼可点击以下链接：

👉阿里云百炼详情了解可点击此官网链接：阿里云百炼官网介绍

👉阿里云百炼控制台页面可点击此链接直接进入：阿里云百炼控制台

阿里云百炼产品月刊【2024年12月】

1. 🤩本月重点highlight

2. 😊产品功能更新

2.1 模型服务

2.2 应用服务

3.3系统服务

3 . 😗模型更新迭代

4. 😲阿里云百炼大模型服务平台12月产品Relase Note

相关产品

相关文章

相关实验场景

相关课程

热门文章

最新文章

相关电子书