飞天技术观丨大模型服务:千锤「百炼」,得其筋骨

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: 大模型应用的表象炫人眼目,但内里却早已发生了巨变。2023年云栖大会上,阿里云CTO周靖人发布了一站式大模型应用开发平台——阿里云百炼,能够帮助企业真正有效地使用好大模型。本文将详解“百炼”的由来以及大模型应用是如何被改造的。

云栖战略参考 2023版头_副本.png

《云栖战略参考》由阿里云与钛媒体联合策划,呈现云计算与人工智能领域的最新技术战略观点与业务实践探索,希望这些内容能让您有所启发。

文 / 张帅 「钛媒体作者」

本文根据作者与通义实验室创新业务中心负责人陈海青的对话整理

可以说,“百模大战”的开始有多喧嚣,结束就有多潦草。行业公认的是,基础预训练大模型最终将收敛到少数几家。更激进的观点是,当下百模大战已经结束,中国市场真正有实力留存下来做基础模型的厂商,或许不超过10家,未来随着市场竞争,这一数字可能还会进一步减少。

下一轮AI,接棒基础大模型热度的是大模型应用,美国市场当下以GPT和Llama为主导的闭源与开源大模型两大阵营已基本成型。所以在美国市场大家都开始卷应用,基本上没人再去卷基础模型,这也将成为中国市场接下来的发展方向。

对于企业而言,应用场景的技术能力迭代极快,对于降本提效有着更高的要求。灵活、便捷、低门槛便成为大模型应用开发的必备条件。在2023年云栖大会上,阿里云CTO周靖人发布了一站式大模型应用开发平台——阿里云百炼。

该平台集成了国内外主流优质大模型,提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。开发者可在5分钟内开发一款大模型应用,几小时即可“炼”出一个企业专属模型,开发者可把更多精力专注于应用创新。

一款大模型应用,是如何千锤“百炼”而来?

AI Agent,从基础模型到大应用的桥梁

大模型时代,所有APP都值得被重做一遍。

举个例子,假设一家金融公司做一个应用,原来的工作流模式是在垂直领域构建从算法、工程、产品到业务的闭环,从金融业收集数据,组建算法团队、产品团队,面向这个领域做分类,采用监督、无监督、半监督等深度学习的方法,构建金融领域的垂直分类应用。

大模型时代,基础模型或SFT(Supervised Fine-tuning)模型自身在不断的修炼升级过程中已经具备了垂直领域的基本认知。企业只需要微调模型,甚至是不调模型,通过Prompt Engineering,再结合Plugin的方式完成一个APP。节约下来的精力,可以让企业更专注于专业域的差异化竞争力。

从底层逻辑来看,大模型其实改变了社会生产力和生产关系,它所展现出来的效率效果不可同日而语。大家会发现基于大模型,小而美的东西越来越多,像原来构建一个业务场景,过去少说也得二三十个人,现在可能几个人的公司就可以做类似的场景,这是生产关系和生产力上的变化。

在大模型之下,不是在一个个垂直领域解决问题,而是用All-in-one的模型解决某个垂直行业多个下游任务的模型和应用场景,带来体系化的解决方案,用户体验和效率就有极大提升,这也是这一代技术相较上一代技术的巨大变化,值得每一个开发者关注。

对于不同的企业,开发大模型应用主要有两种需求。

第一种,中小企业更聚焦在应用场景,这种场景可能不需要做模型的任何调优,而是基于平台已有的应用场景Agent,或者通过基础模型加上Prompts就能直接应用。此时开发者只需要两步工作,第一步,选择合适的模型;第二步,在模型上面加上Prompts或者去构建流程和Agent;再简单一点,也可以直接从阿里云应用广场选择合适的Agent使用,需要更改的仅是本身应用实时接口和能力对接。

第二种,对于中大型企业或者行业生态合作伙伴,需要基于更加专精的下游任务进行调优。前面的步骤和中小企业基本相同,只会多一步流程,即结合已有标注数据,选择模型去做模型的SFT和微调评测。

AI Agent将会是业界内外更加关注的环节。在OpenAI发布GPTs之前,海青就坚定认为,Agent一定是从基础大模型衔接深层次行业应用的重要桥梁。在他看来,未来可能没有APP Store,而会变成Ability Store,也就是变成了各行各业的能力。

AI Agent到底是什么?

从应用角度出发,数据的最终场景是AI,AI的最终场景需要通过Agent触达。从技术角度出发,Agent通过API实现大模型的实时调用,灌注场景数据集结为更专注的存储记忆(Memory)与上下文理解能力,从而灵活应对并解决具体的下游实际任务场景和需求。这些集成与增强的能力可以统称为Ability。

APP与Ability的区别在于,APP通常是指针对特定需求设计的软件应用,其逻辑遵循从专业领域的垂直工程、特定算法的应用到数据的完整闭环。例如淘宝APP就是一个专门为线上购物打造的垂直应用场景。

相较之下,Ability则代表了一种从传统的垂直领域构建,转向更为综合、一体化的模型发展趋势。这种变化得益于基础模型深度增强,不再局限于单一场景,而是从垂直领域的构建方式变成了一个All-in-one的模型。通过这样的基础模型,我们能够轻松构建跨越多个领域的应用程序。随着这种趋势的发展,未来各个领域的应用创新和成长就会变得更加便捷和高效。

所以,在大模型上长出众多Ability的过程中,Agent扮演着至关重要的角色,其不仅是能力的承载者,也是实现这些能力与具体应用场景连接的桥梁。

百炼,“炼”了什么

大模型的应用与传统依赖CPU为核心的应用有所不同,它转向对高性能GPU、高速网络和高效存储的强依赖,但并不是所有企业都有能力自行构建和维护这样的基础设施。因此,大模型的兴起正推动应用逐渐转移到云端。真实案例显示,许多以前倾向于专有化部署的企业,如今也开始探索将应用迁移到公共云,从而进一步推动了公共云上应用和安全技术的发展。

通义千问在今年4月11日进行了全面发布,其实早在2月底,阿里云就已经着手相应功能的研发。那时“百炼”还不叫“百炼平台”,其最初定位是一个产品,是围绕大模型提供一系列面向开发者或者企业的模型工具,是以流程编排为主的工具。

随着百模大战兴起,大模型竞争逐渐升温,企业面临着怎么用及如何用好大模型的挑战。首先,企业需要对模型进行精细调整(Fine-tune),确保企业能够与其本身所在的行业需求及企业的下游任务紧密对齐。这就映射到模型该怎么做微调,甚至做持续训练。

其次,在应用层面不可能只依赖一个静态的API或者能力,无论是特定领域的SFT模型还是通用的基础模型,都需要去思考如何通过搜索增强的生成方式,或结合插件API的方式和能力等一系列应用工具,与企业真实的场景和实时数据接轨。

第三,数据安全也是一大挑战。大模型应用不仅要符合中国的法律法规,还要确保遵循舆论安全、文本安全、安全部署等一系列规则。

基于这些考量,阿里云围绕离线训练、在线工具,再加上安全等功能内测,在2023年云栖大会上,“阿里云百炼”正式亮相。

同时,阿里云也有了新的思考。百炼作为阿里云的大模型应用开发平台,不能只支持通义大模型系列。业界还有大量优秀的基础大模型、SFT模型和行业模型,它们同样需要基于云的基础设施做工具和场景,形成多模型、统一化、可视化的平台能力,成为面向开发者的一站式应用开发平台。

百炼的出现,也预示着在大模型时代,类似百炼这种大模型应用开发平台会成为未来大模型软件开发的主导角色。所有的国内厂商应该会与美国市场一样,更关注于大模型应用,而不是再去卷基础模型。

对于大模型应用开发者而言,不管是什么开发平台,目前的核心都不是软件本身,而是成本。本质上客户选择的不是大模型开发平台,而是基于云计算基础设施和能力,从而获得更高的性价比和投资回报率(ROI)。

以一个简单例子来阐述,企业和开发者所关注的焦点在于:基于阿里云百炼平台深化大模型应用(实质上是利用阿里云的基础设施所构建的模型)是否能够实现更高效率和成本效益(即“多快好省”);大模型能否与具体的下游场景和业务领域有效结合,以打造出符合行业需求的定制模型或者专属模型;以及平台提供的Agent是否足以强化应用。当企业聚焦于特定的下游场景时,他们更希望通过模板化、流程化、系统化、配置化的方式简化对下游任务的构建和API的调用。

目前,百炼平台上的软件工具全免费,用户在百炼平台上选择模型之后,将根据模型的离线和在线使用量支付费用,这也就是所谓的token计费方式。如果客户进行了特定领域的微调(SFT),或选择在公共云上进行VPC的独立部署,这类模型将采用安全域内的部署方式,这种情况下,就会基于硬件加模型的综合使用来制定定价策略。

随着应用需求的不断演进,阿里云百炼平台的未来发展将持续扩展。今天的百炼已经实现了从无到有的跨越,打造成为了一个覆盖从基础模型研发到应用部署的全面平台。结合未来大模型在应用化的发展,百炼平台有三个大的发展方向:

首先,对于离线特定领域微调(SFT)而言,更多还是把配置化的能力和参数开放出来,致力于提供更为直观、易操作的工具,例如提供SFT模板和能力,帮助客户快速搭建满足下游任务的场景。此外,对于离线模板化、评测工具的升级和效能提升也是关键点。

第二个方向是围绕Agent概念建立应用平台。百炼预计将推出以Agent为核心的平台能力,这将极大的助力开发者和企业快速开发和部署应用。换句话说,就是在百炼上,基于基础模型或者行业模型开发出更多的Agent模板,或者构建Agent工具,打造一个Agent构建能力和Agent模板体系。

第三个方向是数据安全。随着企业和开发者不断增加,面向数据安全域的平台化能力将持续升级,从而进一步保障客户的API数据和上传数据的整体安全,甚至会推出基于VPC的数据安全域的部署模式,以此构建一个大模型应用安全体系。

被大模型改造的应用

一个大模型应用是如何被改造的?以天猫精灵为例,天猫精灵是一个天然的个人助理类产品和场景,从主链路来讲,上一代模型是以意图为识别,基于检索或者知识匹配的逻辑,这也造成了过去的天猫精灵对世界知识的了解比较窄,这也是第一个改造部分。天猫精灵通过大模型增强了知识域的宽度,原来很多无法回答的问题现在有了新的答案。

第二个改造部分就涉及很多与内容场景的连接,比如查天气情况、订机票,甚至做淘宝的退款。天猫精灵原来的做法是通过一个任务流程的配置系统AliGenie实现,现在是通过大模型COT(Chain-of-thought,思维链)的插件能力,来做整体的融合和升级。如此,使得天猫精灵调用每个API变得更加语义化和场景化。

第三部分,随着大模型向多模态领域拓展,我们开始见证它在文本生成图像(文生图)和语音处理方面的发展。这些进展对于天猫精灵来讲,具备多模态能力的天猫精灵能够显著扩展其业务场景的边界。比如通过带屏幕的硬件,天猫精灵就能做到更多内容衔接以外的核心能力,在教育场景、音乐场景等有更好的沉浸式体验。

早期阿里云百炼平台上的客户,更多还是阿里云上的企业用户。随着时间的推移,百炼平台涌入了非常多的开发者,给阿里云提出了各种各样的需求,例如更好的Prompt Engineering模板,更好的模型校正或者模型的使用方式等。

开发者也对百炼平台的大模型评测提供了很多的意见,一个模型评测的构建很重要,百炼与各大厂商有一个很大的区别,评测做的特别综合,从单独的评测标注到多轮评测,结合Elo评测,甚至还有一张表,列举出各个模型在世界知识、推理、代码、数学的表现,百炼平台需要帮助客户更好地评测他构建的模型,以及提供选择模型的参考。

开发者使用百炼的过程中,也加速了百炼平台以及大模型应用的发展。从百炼平台可以观察到,搜索增强类应用异军突起,而且是现在企业或者个人应用最广泛的应用。数据分析类应用排名靠前,将自然语言转换为机器语言,去比较不同的数据和查询,甚至做深度的数据分析,这会成为一个主流趋势。

另外就是综合性NLP(Natural Language Processing,自然语言处理)的发展,原来基础NLP会分成文本分类、文本摘要、实体识别、情感分类等领域,现在很多客户用一个大模型同时完成基础NLP的多个任务,帮助他做整体的数据结构化。此外泛写作类,如新闻写作、公文写作也有很大的应用数量。

大模型应用的表象炫人眼目,但内里却早已发生了巨变,通过千锤“百炼”,得其筋骨,大模型应用才能一步步丰满起来。

相关实践学习
2分钟自动化部署人生模拟器
本场景将带你借助云效流水线Flow实现人生模拟器小游戏的自动化部署
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
6天前
|
人工智能 自然语言处理 机器人
在钉钉中与百炼DeepSeek大模型对话
DeepSeek发布了两款先进AI模型V3和R1,分别适用于对话AI、内容生成及推理任务。阿里云百炼提供DeepSeek模型API,通过AppFlow可在钉钉中快速配置与DeepSeek的对话功能,无需代码开发,10分钟内完成全部设置。用户需在钉钉开放平台创建应用、配置消息卡片、授权权限,并使用计算巢AppFlow创建连接流,最后配置钉钉机器人并发布应用版本,即可实现与DeepSeek大模型的交互。
在钉钉中与百炼DeepSeek大模型对话
|
1月前
|
人工智能 自然语言处理 API
用AI Agent做一个法律咨询助手,罗老看了都直呼内行 feat.通义千问大模型&阿里云百炼平台
本视频介绍如何使用通义千问大模型和阿里云百炼平台创建一个法律咨询助手AI Agent。通过简单配置,无需编写代码或训练模型,即可快速实现智能问答功能。演示包括创建应用、配置知识库、上传民法典文档、构建知识索引等步骤。最终,用户可以通过API调用集成此AI Agent到现有系统中,提供专业的法律咨询服务。整个过程简便高效,适合快速搭建专业领域的小助手。
220 22
|
2月前
|
Python
阿里云百炼大模型生成贪吃蛇小游戏
阿里云百炼大模型生成的贪吃蛇小游戏增加了背景音乐功能。通过Pygame的`mixer`模块,实现背景音乐的加载和播放。关键步骤包括:1. 安装Pygame;2. 准备音乐文件;3. 修改代码以初始化混音器并加载音乐。游戏开始时自动播放背景音乐,支持无限循环。此外,还可以根据需要调整游戏速度、难度及添加更多音效。
69 13
|
2月前
|
安全 网络协议 Java
【最佳实践系列】高并发调用百炼语音合成大模型
本文介绍了阿里云百炼的CosyVoice语音合成大模型及其高并发调用优化方案。CosyVoice支持文本到语音的实时流式合成,适用于智能设备播报、音视频创作等多种场景。为了高效稳定地调用服务,文章详细讲解了WebSocket连接复用、连接池和对象池等优化技术,并通过对比实验展示了优化效果。优化后,机器负载降低,任务耗时减少,网络负载更优。同时,文章还提供了异常处理方法及常见问题解决方案,帮助开发者更好地集成和使用SDK。
|
3月前
|
人工智能 自然语言处理 算法
Jarvis×百炼,打造大模型智慧出行客服
本次分享由哈啰集团高级算法专家郭佳盛主讲,主题为“Jarvis×百炼,打造大模型智慧出行客服”。内容涵盖AI在智慧出行领域的应用探索、AI加持客服全链路解决方案、哈罗智能客服的大模型应用、大模型在C端与B端的应用探索,以及企业内部大模型构建与运营。通过实例和经验分享,展示了哈啰如何将大模型应用于实际业务,提升用户体验和运营效率。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
阿里云百炼大模型:引领企业智能化升级的下一代 AI 驱动引擎
随着人工智能技术的快速发展,大规模预训练模型正在改变各行各业的智能化进程。阿里云百炼大模型(Ba-Lian Large Model)作为阿里云推出的企业级 AI 解决方案,通过深度学习、自然语言处理、计算机视觉等前沿技术,帮助企业实现智能化升级,提升业务效率和创新能力。本文将详细介绍阿里云百炼大模型的核心技术、应用场景及其优势,帮助企业更好地理解和利用这一革命性工具。
1471 2
|
6月前
|
存储 人工智能 机器人
通义大模型百炼融合AnalyticDB, 10分钟打造企业微信AI助手
通义大模型百炼融合AnalyticDB, 10分钟打造企业微信AI助手。只需简单几步,即可在企业微信集成AI助手,提升客户服务体验。参与“10分钟打造企业微信AI助手”活动,完成指定任务即可赢取定制礼品,数量有限,先到先得。
|
6月前
|
SQL 自然语言处理 数据建模
阿里云百炼|析言GBI在中国一汽上线,大模型技术融入数智化转型
中国一汽自2022年起启动数智化转型,针对传统BI系统的局限性,如报表生成慢及数据处理不灵活等问题,与阿里云合作开发GPT-BI(阿里云百炼|析言GB)。该应用基于通义千问大模型,支持自然语言查询,自动产生分析图表,覆盖九大决策场景,准确率达92.5%。显著提高了决策效率与数据治理水平,引领汽车行业数智化转型新趋势。
|
7月前
|
人工智能 关系型数据库 OLAP
通义大模型百炼融合AnalyticDB, 阿里云专家手把手带你10分钟创建网站AI助手
本次陪跑班将从一个企业开发者的角度出发,手把手带你用AnalyticDB for PostgreSQL的高效向量引擎与阿里云自主研发的通义大模型服务平台百炼,只需10分钟即可为您的网站添加一个AI助手。加入钉群观看直播课程,更有精彩好礼等你拿!
|
8月前
|
人工智能 自然语言处理 数据可视化
体验评测报告:阿里云百炼平台——大模型应用构建的全方位工具箱
体验评测报告:阿里云百炼平台——大模型应用构建的全方位工具箱
504 2