AI 应用之成本节约实践

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
视觉智能开放平台,图像资源包5000点
简介: 本文探讨了如何避免高成本的模型微调,通过任务拆解和提示词调优实现业务目标。文中提到,当大语言模型不能直接满足需求时,微调涉及大量工作,包括数据准备、模型训练及GPU资源。为降低成本,作者提出了两步方法:1) 任务拆解,将复杂任务分解为简单子任务,利用模型优势处理部分;2) 提示词调优,优化输入以引导模型更高效地响应。虽然这可能不适用于所有情况,但能有效减少对模型微调的依赖。

一、前言

本文主要分享如何通过任务拆解和提示词调优满足业务需要,避免进行模型微调造成巨大的模型训练和 GPU 硬件成本的一个案例。

业务背景大致如下:我们需要设计一个支持用户输入一段信息,然后调用某个大语言模型生成目标内容的功能。然而,我们通过尝试发现无论如何都很难得到令人满意的效果。

因此有人提议对大语言模型进行微调。

但是模型微调的成本相对较高。模型微调需要开发同学构造很多训练集和验证集,需要算法同学在大模型平台进行模型训练,需要对结果进行评估,模型训练好以后还需要专门的 GPU (预计独占 4 张 A 10)上进行部署和后期维护等,成本很高。

那么是否可以有更好的解法? 是否可以不用微调就可以实现预期的功能呢?这是我们待解决的问题。

接下来,我将分享解决思路和具体方法。

二、解法

我们主要采用了两种方法来解决这个问题,其一是任务拆解,其二是提示词调优。

通过任务分解,降低每个步骤的复杂度,让某个环节可以用上大模型,让大模型的表现更好;然后通过提示词调优让用上大模型的环节接近大模型的能力上限,实现更好地业务效果。

需要强调的是,采用任务拆解 + 提示词调优的方式只能解决部分问题,有些情况还是需要依赖模型微调来解决。由于模型微调的成本相对较高,如果通过任务拆解和提示词调优可以满足业务需求获得不错的业务效果,那么可以节约模型微调的成本。如果你的业务场景,在调研和实验后发现模型微调不可避免,还是需要果断进行微调。

2.1 任务拆解

根据教育心理学中的认知负荷理论(Cognitive Load Theory),人的大脑有一个信息处理的“容量”,就像电脑的内存一样,有限的。学习新知识或技能时,如果信息过多或太复杂,超过了这个容量,大脑就会感到“过载”,学习效果就会下降。想要应对认知负荷,需要简化学习内容,尽量将复杂的内容分解成小部分,一次只学一部分,避免信息过载。


将复杂任务拆解成多个更简单的的小任务从而更好地完成,在计算机科学和软件工程领域也有非常多的示例。


① 如工作编译器将高级编程语言的代码转换为机器能够理解的低级语言代码,这也是一个复杂的任务,但可以分解成多个小任务:词法分析、语法分析、语义分析、中间代码生成、优化、目标代码生成,很好地实现了该功能。


② 软件架构中的 MVC 架构,主要包括:视图层、控制层和模型层,通过分离关注点来简化开发和维护,使得每一层都有明确的职责,提高代码的可读性和可维护性。


同样地,对于当前大语言模型无法胜任的任务,我们可以进一步拆解,拆解成大模型更容易完成的任务。


比如我们可以将复杂的任务拆解成多个步骤,我们应根据每个步骤的特点选择最佳的处理方式。比如有些大模型可以胜任的任务优先交给大模型;有些只有人工才能完成的则交给人来完成;有些大模型处理效果都不如采用工程化方式效果好的,则应该采用工程化的方式生成;而有些环节则需要 AI 和人工配合完成最后,我们只需要在产品设计时,将这些步骤自然地串起来即可。


2.2 提示词调优

既然我们不打算进行模型微调,意味着大语言模型处理当前某个任务的上限相对固定。此时,我们可以通过提示词调优的方式不断逼近大语言模型的能力上限,实现更好地业务效果。

我们可以将提示词结构化,让提示词更全面,让大语言模型更容易理解。如在概述中给出大模型需要扮演的角色、当前任务的背景;可以在提示词中给出指导大模型处理的流程和步骤,给出大语言模型推理所需要依赖的知识;给出大语言模型推理时可以参考的示例;我们还可以通过,给出正向和负向的要求来控制模型的输出。


我们还可以使用 GPTs 和  Coze 的 Bot 创建助手来帮我们自动编写提示词。

可以使用 Coze 的自动优化提示词功能,直接对我们的提示词进行优化。

我们还可以拿  Bad Case 和对应的提示词,让模型解释原因并给出建议,进一步调整优化提示词。

实际的业务应用中提示词经常需要变更,大家可以参考我的另外一篇文章 《AI 提示词模板相关的架构设计》提高代码的可修改性、安全性和可靠性以及提高性能。


同时,建议大家在提示词调优时要进行详细的文档记录,包括:提示词调优的时间和轮数、本轮调优的主要 Bad Case、针对每个 Bad Case 的调优方法等。调优之后需要用相同的测试用例对新版的提示词效果进行评分,进行新老版本的评分对比,以增强调优效果的说服力。


由于保密的要求,这里无法给出具体的提示词示例。如果大家想系统学习提示词技巧,可以阅读我的相关文章:《一文掌握大模型提示词技巧:从战略到战术》

三、总结

对于并不是非要进行模型微调才能解决问题的场景,我们可以优先采用任务分解降低任务的难度,提高业务落地的可能性。任务拆解后我们可以任务的特点,选择让 AI 、人工和工程来完成对应的任务。同时,我们可以通过提示词调优不断逼近模型能力上限,发挥出更好地业务效果。

对于可以通过任务分解和提示词调优就能够满足业务需求的场景,可以有效节约成本。

相关文章
|
8天前
|
机器学习/深度学习 传感器 人工智能
AI与未来医疗:重塑健康管理新格局随着人工智能(AI)技术的飞速发展,医疗行业正迎来一场前所未有的变革。AI不仅在数据分析、诊断支持方面展现出巨大潜力,还在个性化治疗、远程医疗等多个领域实现了突破性进展。本文将探讨AI技术在医疗领域的具体应用及其对未来健康管理的影响。
人工智能(AI)正在彻底改变医疗行业的面貌。通过深度学习算法和大数据分析,AI能够迅速分析海量的医疗数据,提供精准的诊断和治疗建议。此外,AI在远程医疗、药物研发以及患者管理等方面也展现出了巨大的潜力。本文将详细探讨这些技术的应用实例,并展望其对健康管理的深远影响。
|
3天前
|
人工智能 Java 测试技术
低成本工程实践-AI帮我写代码做需求
本文主要讲述,以“无需训练模型”的方式实现:AI智能分析功能需求、写代码、review代码解决特定业务问题的实践过程
低成本工程实践-AI帮我写代码做需求
|
9天前
|
人工智能 运维 负载均衡
10 分钟构建 AI 客服并应用到网站、钉钉或微信中
《10分钟构建AI客服并应用到网站、钉钉或微信中》的解决方案通过详尽的文档和示例代码,使具有一定编程基础的用户能够快速上手,顺利完成AI客服集成。方案涵盖高可用性、负载均衡及定制化选项,满足生产环境需求。然而,若文档不清晰或存在信息缺失,则可能导致部署障碍。实际部署中可能遇到网络、权限等问题,需逐一排查。云产品的功能、性能及操作配置便捷性直接影响解决方案效果,详尽的产品手册有助于快速解决问题。总体而言,该方案在各方面表现出色,值得推荐。
|
7天前
|
人工智能 运维 云计算
阿里云无影AI云电脑亮相 体验大幅升级
9月20日,2024云栖大会上阿里云无影AI云电脑全新亮相,基于最新的终端云计算技术和AI大模型能力,无影的综合体验大幅提升,新增了弹性升降配、双网自由切换、多端操作系统知识库问答、编码大师等AI智能体功能,为安全办公、个人娱乐带来全新的云上流畅体验,更可畅玩《黑神话:悟空》等3A游戏大作。同时,无影还宣布向开发者全面开放应用中心生态,开发者可免费入驻。
|
1天前
|
机器学习/深度学习 人工智能 算法
AI在医疗领域的应用与挑战
【9月更文挑战第25天】AI技术在医疗领域的应用日益广泛,从辅助诊断到药物研发,再到健康管理等方面都取得了显著成果。然而,随着AI技术的深入应用,也面临着数据隐私、算法透明度、法规政策等挑战。本文将探讨AI在医疗领域的应用现状与未来趋势,以及面临的主要挑战和解决方案。
|
2天前
|
数据采集 人工智能 安全
AI项目高昂成本与数据问题阻碍进展,2025年前30%的GenAI项目或将搁浅
AI项目高昂成本与数据问题阻碍进展,2025年前30%的GenAI项目或将搁浅
|
3天前
|
机器学习/深度学习 人工智能 自动驾驶
揭秘AI的魔法:机器学习在图像识别中的应用
【9月更文挑战第24天】当AI技术遇到图像识别,就像是打开了新世界的大门。本文将深入浅出地介绍机器学习在图像识别领域的应用,通过实例和代码展示如何让机器“看懂”图片。让我们一起探索AI的魔法,开启一段科技与创新的旅程!
|
3天前
|
人工智能 算法 新能源
AI在能源管理中的应用:提升能源效率与可持续性
【9月更文挑战第24天】AI技术在能源管理中的应用,正以其独特的优势与潜力,引领着能源行业向更加智能化、高效化和可持续化的方向发展。随着技术的不断进步、政策的持续支持以及应用场景的不断拓展,AI技术将在能源管理中发挥更加重要的作用,为实现全球能源转型与可持续发展贡献更大力量。我们有理由相信,在AI技术的助力下,未来的能源管理将更加高效、智能和可持续。
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI在医疗诊断中的应用
【8月更文挑战第50天】本文将探讨人工智能(AI)在医疗领域的应用,特别是其在医疗诊断中的作用。我们将通过具体的代码示例,展示如何使用机器学习算法进行疾病预测。本文的目标是为读者提供一个关于AI在医疗诊断中的实际应用的全面视角,以及如何利用这些技术来改善医疗服务的质量和效率。
37 11
|
6天前
|
机器学习/深度学习 人工智能 搜索推荐
AI在医疗领域的应用与前景探析
随着人工智能(AI)技术的迅猛发展,它在医疗领域的应用正逐步改变着传统医疗模式。本文将探讨AI在医疗诊断、治疗、管理等方面的应用及其未来发展前景,旨在为读者提供一个清晰、全面的了解。