阿里云百炼产品月刊【2024年12月】

简介: 12月,阿里云百炼带来多项技术革新与服务升级。本月重点包括VL模型部分规格降价,上线多个新模型,如视觉推理模型qvq-72b-preview、多语言文本统一排序模型gte-rerank和人物视频生成模型videoretalk等。应用模块新增音视频互动、互联网搜索及意图选择等功能,极大丰富了应用场景。此外,新增Context Cache功能和batch调用支持,提升了响应速度并降低了费用。

月刊banner2.jpg

本月月刊是2024年的末尾刊,时间过得真快啊🤗,在这祝大家新年快乐呀!🔶在这个寒冷的季节里,我们的热情不减,持续为您带来最新的技术革新和服务升级。本月,我们不仅上线了一大批的模型,还增强了智能体应用的功能,以确保您在百炼的每一次交互都能更加高效和精准。通过不断倾听来自社区的声音以及内部团队的努力探索,我们在性能提升、用户体验改善及安全保障方面取得了显著成果。希望这些改进能够帮助每一位使用者更好地应对工作中的难题,激发无限创意。让我们一起迎接新的一年,携手共创更加辉煌的成绩!


🤩本月重点highlight

  1. 通义千问VL图片理解大模型部分规格降价,qwen-vl-plus模型输入降价81.3%,输出降价43.8%。qwen-vl-max模型输入降价85%,输出降价55.0%。
  2. 新上线了较多模型:如专注于提升视觉推理qvq-72b-preview模型,多语言文本统一排序gte-rerank模型,人物视频生成videoretalk模型等新能力模型,也上线了plus的快照等新模型。
  3. 本月在应用模块也迭代了较多新功能。支持音视频互动,开启互联网搜索,支持意图选择等,极大的丰富了应用能力
  4. 新增了Context Cache 功能以及支持batch调用的模型,提升了模型的响应速度,减少了费用。


1. 😊产品功能更新

1.1模型服务

  • 通义千问VL大模型部分规格下调了推理调用费用:qwen-vl-plus模型输入降价81.3%,输出降价43.8%。qwen-vl-max模型输入降价85%,输出降价55.0%。详情请参见通义千问VL系列模型降价通知
  • 语音合成CosyVoice大模型支持声音复刻用户仅需提供10~20秒的音频,即可迅速生成高度相似且听感自然的定制声音。详情请参见声音复刻
  • 通义千问API调用模型新增search_options参数:配置联网搜索相关的参数,如搜索来源、搜索数量等。可用于qwen-max、qwen-plus、qwen-turbo模型,使用方法请参见通义千问API文档-DashScope

image.png

  • 新增通义千问2.5-7B支持 SFT 调优:通义千问2.5-7B支持 SFT 全参和高效调优。详情请参考模型调优

  • 模型部署支持按调用量计费:按调用量计费的方式支持部署 qwen2.5-7B、14B、32B、72B 和 qwen2-7B 调优后的模型。详情请参考模型部署
  • 新增 Context Cache 功能:Context Cache 技术通过缓存不同推理请求中的公共前缀内容,减少重复计算的需求,从而在保持回复质量的同时,提高了响应速度并降低了使用成本。这项技术特别适用于多轮对话或针对同一主题(如一本书)的多次查询等场景。当前仅支持qwen-plus型。详情请参考Context Cache(上下文缓存)
  • batch支持任务通知:Batch支持任务完成之后通知,减少不必要的任务查询,提高效率。详情参见Batch
  • 新增支持batch调用的模型:qwen-long、qwen-vl-max、qwen-vl-plus、qwq-32b-preview支持batch调用,Batch调用的费用为实时调用的50%。详情参见Batch

1.2应用服务

  • 应用支持互联网搜索:开启后,同时调用互联网搜索和知识库回答用户query,由大模型进行生成结果。

  • 应用支持音视频交互:智能体应用和工作流应用支持音视频实时互动,提供了便捷的调试窗口。视频交互当前仅支持VL模型体验,详情请参考智能体应用

  • 工作流画布功能优化意图分类节点支持选择意图模式单选模式和多选模式,文本转换节点支持JSON格式输出。详情请参考工作流应用

  • 智能体编排应用支持条件判断节点:支持在节点内部对参数进行条件判断,然后通过不同分支的文本转换节点生成输出回复。详情请参考智能体编排应用


1.3系统服务

  • ram账号拥有百炼的管理员,可以查看已授权业务空间内全部的调用统计信息。详情请参见调用统计

2. 😗模型更新迭代

1️⃣新增视觉推理模型:新增qvq-72b-preview模型,专注于提升视觉推理能力,尤其在数学推理领域。使用方法请参见视觉理解。当前仅支持API调用,模型广场还未开通体验入口。

qvq-72b-preview模型规格:

2️⃣新增qwen-plus快照模型:新增qwen-plus-2024-12-20快照模型,相对于通义千问-Plus-1125版本,中英文整体能力有提升,中英常识知识类、阅读理解能力提升较为显著,codeswtich现象相比上一版有显著改善,中文指令遵循能力显著提升。详情请参见:使用说明

qwen-plus-2024-12-20模型规格:

3️⃣新增qwen2-vl-72b-instruct模型:qwen2-vl-72b-instruc在多个视觉理解基准测试中取得了最先进的成绩,显著增强多模态任务的处理能力,免费体验中。详情请参见视觉理解

qwen2-vl-72b-instruc模型规格:

4️⃣新增多语言翻译模型:qwen-mt-turbo&qwen-mt-plus翻译模型已上线,擅长中英互译、中文与小语种互译、英文与小语种互译,小语种包括日、韩、法、西、德、葡(巴西)、泰、印尼、越、阿等26种。详情请参见使用说明

qwen-mt-turbo&qwen-mt-plus模型规格:

5️⃣新增gte-rerank模型:是多语言文本统一排序模型,通常用于语义检索、RAG等场景,可以简单、有效地提升文本检索的效果,目前正在限时免费中。点击🔗快速开始进行体验。

gte-rerank模型规格:

6️⃣新增意图分类模型:tongyi-intent-detect-v3意图模型已上线,可实现基于 API的意图和槽位参数联合预测,详情请参见使用说明

tongyi-intent-detect-v3模型规格:

7️⃣新增语音模型:新增qwen-audio-turbo-latest、qwen-audio-turbo-2024-12-04模型,相较于qwen-audio-turbo-2024-08-07版本,大幅提升语音识别准确率,并新增了语音聊天能力。详情请参见音频理解

qwen-audio-turbo-latest、qwen-audio-turbo-2024-12-04模型规格:

8️⃣新增videoretalk模型:声动人像VideoRetalk是一个人物视频生成模型,支持根据人物视频和音频生成对口型视频。详情请参见快速开始

VideoRetalk模型单价:

3. 😲阿里云百炼大模型服务平台12月产品Relase Note

功能所属模块

功能主要描述

模型上线

  • 新增qvq-72b-preview模型:它有卓越的视觉理解和复杂问题解决能力,能够像物理学家一样冷静应对复杂的物理问题,并通过逻辑推理找到解决方案。有效缩小与领先模型间的差距。
  • 新增qwen-plus-2024-12-20快照模型:通过大量的高质量数据训练而成,不仅在中文领域表现出色,在多语言支持上也达到了新的高度,极大地增强了跨文化交流的能力,阅读理解能力显著增强。
  • 新增qwen2-vl-72b-instruct模型:qwen2-vl-72b-instruc拥有720亿个参数,能够处理更加复杂和多样化的任务,除支持中英文外,还增加了对27种其他语言的支持,扩展了模型的应用范围。
  • 新增多语言翻译模型:Qwen-mt-turbo专注于提供快速且准确的翻译服务,特别适合需要即时响应的场景,如在线交流、即时消息等。Qwen-mt-plus则更侧重于专业领域文本的精确翻译,比如法律文件、技术文档等复杂内容,能够更好地理解上下文语境,提供更加流畅自然的语言转换。
  • 新增gte-rerank模型:是多语言文本统一排序模型,结合了全局文本嵌入(GTE)与重排序技术,显著提升了信息检索和推荐系统的性能。
  • 新增意图分类模型:一款高效能的自然语言处理工具,专门用于准确理解用户文本背后的真正意图。该模型基于大规模预训练技术,结合了深度学习与迁移学习的优势,能够从海量数据中提炼出丰富的语义信息。适用于建智能客服、推荐系统等应用场景
  • 新增qwen-audio-turbo-latest、qwen-audio-turbo-2024-12-04模型:在语音识别准确性、多语言支持、实时转录速度及背景噪音过滤方面表现出色,能够有效提升会议记录、在线教育、内容创作等场景下的用户体验。
  • 新增videoretalk模型:能够实现高质量的视频人像编辑,包括面部表情、头部姿态和口型同步等复杂任务,使得生成的内容自然流畅。可以应用于不同场景下的多种视频类型,还支持实时交互式编辑。

模型服务

  • 通义千问VL大模型部分规格下调了推理调用费用:qwen-vl-plus模型输入降价81.3%,输出降价43.8%。qwen-vl-max模型输入降价85%,输出降价55.0%。降低了用户使用该模型的成本。能够以更低的预算享受到高质量的多模态理解和生成能力,包括但不限于图像理解、图文对话等。
  • 语音合成CosyVoice大模型支持声音复刻:仅需10-20秒的音频样本即可完成声音复刻,支持中文、英语等多种语言的语音合成,以及跨语言语音合成,支持流式推理模式,实现实时语音合成,适合需要即时响应的应用场景。
  • 通义千问API调用模型新增search_options参数配置联网搜索相关的参数,如搜索来源、搜索数量等。可用于qwen-max、qwen-plus、qwen-turbo模型。
  • 新增通义千问2.5-7B支持 SFT 调优:针对性的微调,模型能够更好地理解特定领域或行业的术语和上下文,SFT调优允许根据用户的具体需求定制模型表现,无论是调整语气风格还是增强某些特定功能。
  • 模型部署支持按调用量计费:只需为实际使用的模型调用次数付费,无需预付费用,有效降低成本。按需付费模式使得用户可以根据业务需求灵活调整模型使用量,避免资源浪费。
  • 新增 Context Cache 功能:通过缓存重复性输入的大量数据,对于公共上下文仅收取一次费用,最高可节省90%的成本。显著提升了模型的响应速度。
  • batch支持任务通知:减少不必要的任务查询,提高效率。
  • 新增支持batch调用的模型:qwen-long、qwen-vl-max、qwen-vl-plus、qwq-32b-preview支持batch调用,Batch调用的费用为实时调用的50%

应用管理

  • 应用中支持开启互联网搜索:能够极大地扩展信息获取的范围,可以访问到整个互联网上海量的信息资源,提高信息查找的效率和准确性。
  • 应用支持音视频交互:提供了更加直观、生动的交流方式,可以实现即时反馈,对于需要快速响应的服务(如紧急救援)来说至关重要。
  • 意图分类节点支持选择意图模式:单选模式和多选模式
  • 文本转换节点支持JSON格式输出

系统管理

  • ram账号拥有百炼的管理员,可以查看已授权业务空间内全部的调用统计信息。

🚀需要了解阿里云百炼可点击以下链接:

👉阿里云百炼详情了解可点击此官网链接:阿里云百炼官网介绍

👉阿里云百炼控制台页面可点击此链接直接进入阿里云百炼控制台


欢迎大家在评论区交流探讨调用百炼新能力的体验与经验 。如果您在体验过程中有遇到什么问题需要我们解答,可以在评论区中留言探讨或是加入我们的官方支持群(群号:77600022533)进行交流反馈!

1732159465607 (1).png

相关实践学习
如何快速体验知识检索增强应用
在应用广场中您可以挑选智能体API应用、官方预置完整工程链路的知识检索增强(RAG)应用、流程编排应用,以及官方最佳实践的写作应用妙笔等,通过应用快速将通义千问系列等大语言模型能力接入到业务解决方案中。
相关文章
|
5月前
|
自然语言处理 数据挖掘 关系型数据库
欢迎加入阿里云百炼·析言GBI产品官方答疑群
在使用析言产品时遇技术难题?官方答疑群助您快速解决!群内可与其他用户交流、获取技术支持,轻松找到答案。欢迎扫描二维码或搜索钉钉号:94725009401加入我们,了解更多详情及VPC能力,让数据分析变得简单高效。
|
1月前
|
SQL 前端开发 关系型数据库
阿里云百炼|析言GBI:产品博士的智能分析利器
本文介绍了阿里云“云知道”平台的云指针频道如何利用大模型实现从自然语言到SQL的转换,从而快速提供数据分析服务。通过阿里云AnalyticDB PostgreSQL版数据库存储数据,并结合析言GBI产品能力,实现了高效的数据查询与可视化展示。
|
1月前
|
数据采集 人工智能 自然语言处理
阿里云百炼产品月刊【2024年11月】
11月,阿里云百炼平台迎来一系列重大更新,包括推出QwQ、qwen-turbo、qwen-Plus等多个新模型及快照版本,强化AI推理、文本生成、视觉理解等能力。此外,还优化了模型管理、数据处理等功能,提升了用户体验。
|
4月前
|
人工智能 搜索推荐 云栖大会
2024云栖大会阿里云百炼产品发布论坛邀请您的参与和见证
云栖大会始于2009年,2015年正式更名,至今已成功举办15届,见证了中国云计算发展的关键时刻。大会汇聚全产业链,展示云计算及相关领域的趋势与创新。2024年9月19日,阿里云百炼专场将在云栖小镇D场馆2-2厅举行,探讨多端融合与开放架构,加速AI创新应用落地,共建繁荣生态。欢迎扫码注册参会,共筑智能化未来。
2024云栖大会阿里云百炼产品发布论坛邀请您的参与和见证
|
6月前
|
自然语言处理 算法 API
阿里云百炼产品初体验评测
从小白入门到操作体验,带领大家一起探索阿里云百炼大模型平台的奥秘。
17237 9
阿里云百炼产品初体验评测
|
14天前
|
Python
阿里云百炼大模型生成贪吃蛇小游戏
阿里云百炼大模型生成的贪吃蛇小游戏增加了背景音乐功能。通过Pygame的`mixer`模块,实现背景音乐的加载和播放。关键步骤包括:1. 安装Pygame;2. 准备音乐文件;3. 修改代码以初始化混音器并加载音乐。游戏开始时自动播放背景音乐,支持无限循环。此外,还可以根据需要调整游戏速度、难度及添加更多音效。
44 13
|
11天前
|
安全 网络协议 Java
【最佳实践系列】高并发调用百炼语音合成大模型
本文介绍了阿里云百炼的CosyVoice语音合成大模型及其高并发调用优化方案。CosyVoice支持文本到语音的实时流式合成,适用于智能设备播报、音视频创作等多种场景。为了高效稳定地调用服务,文章详细讲解了WebSocket连接复用、连接池和对象池等优化技术,并通过对比实验展示了优化效果。优化后,机器负载降低,任务耗时减少,网络负载更优。同时,文章还提供了异常处理方法及常见问题解决方案,帮助开发者更好地集成和使用SDK。
|
2月前
|
人工智能 自然语言处理 算法
Jarvis×百炼,打造大模型智慧出行客服
本次分享由哈啰集团高级算法专家郭佳盛主讲,主题为“Jarvis×百炼,打造大模型智慧出行客服”。内容涵盖AI在智慧出行领域的应用探索、AI加持客服全链路解决方案、哈罗智能客服的大模型应用、大模型在C端与B端的应用探索,以及企业内部大模型构建与运营。通过实例和经验分享,展示了哈啰如何将大模型应用于实际业务,提升用户体验和运营效率。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
阿里云百炼大模型:引领企业智能化升级的下一代 AI 驱动引擎
随着人工智能技术的快速发展,大规模预训练模型正在改变各行各业的智能化进程。阿里云百炼大模型(Ba-Lian Large Model)作为阿里云推出的企业级 AI 解决方案,通过深度学习、自然语言处理、计算机视觉等前沿技术,帮助企业实现智能化升级,提升业务效率和创新能力。本文将详细介绍阿里云百炼大模型的核心技术、应用场景及其优势,帮助企业更好地理解和利用这一革命性工具。
906 1
|
5月前
|
SQL 自然语言处理 数据建模
阿里云百炼|析言GBI在中国一汽上线,大模型技术融入数智化转型
中国一汽自2022年起启动数智化转型,针对传统BI系统的局限性,如报表生成慢及数据处理不灵活等问题,与阿里云合作开发GPT-BI(阿里云百炼|析言GB)。该应用基于通义千问大模型,支持自然语言查询,自动产生分析图表,覆盖九大决策场景,准确率达92.5%。显著提高了决策效率与数据治理水平,引领汽车行业数智化转型新趋势。

相关产品

  • 大模型服务平台百炼