商业上怎么合理运用提示工程,RAG和模型微调

简介: 商业上怎么合理运用提示工程,RAG和模型微调

提示工程、RAG 还有微调在工程当中应该怎么选择,今天小余哥来给大家讲清楚。

那首先呢,我们要弄清楚大模型是怎么训练出来的。

训练大模型,首先需要海量的数据,然后通过训练的方法来构造一个大模型。然后这个大模型,其实它具备了非常多的能力,因为我们在训练的过程里面,其实使用到的数据是非常多样化的,包括金融数据、医疗数据、智能制造的数据、教育数据,还有好多好多其他行业的数据。


image.png


然后从另外一个角度,我们可以把这个大模型比作是智能化的大脑,比如说一个人的大脑。那假如这个人就是我,而且具备了各种能力,比如说 AI 的能力、金融科技的能力、医疗领域的能力、管理能力,还有一些其他的能力。那下面,我通过一个案例给大家讲一下这三者之间的主要的区别是什么。那假如屏幕前的你有一个问题想问我,所以你找到了我,然后问了一个问题,但是很不幸我没有给出你想要的答案。所以我们接下来要剖析一下为什么没有给出一个正确的答案。那这里,可能有三种不同的情况要考虑。那第一种情况,其实也比较容易想到的,就是你可能没有问清楚,就是你没有让我明白你到底想做什么。所以这个时候,就是要把这个问题整理成一个让我能听得懂,然后更详细的一种方式要传递给我,我才能有可能帮到你。那这个过程本质上对应到提示工程,如果我们接下来使用提示工程的方法能解决这个问题,那我们就结束了。如果还是没有解决,我们要考虑第二种情况。那有可能是我欠缺相关领域的知识。那打个比方,如果你问了我一个 AI 加建筑的问题,其实我对 AI 比较熟悉,但对建筑其实不太熟悉的,而且我曾也服务过很多其他行业的企业,所以我本身掌握一定的方法论,但是因为我不知道相关的知识,所以我目前是帮不到你。所以这个时候怎么办,一个正确的方案是给我讲清楚问题,最好围绕问题给我把建筑行业的相关的一些背景知识给我讲清楚,让我至少明白问题的背景、问题的场景以及要解决的问题本身,有了这些相关的知识,我们也把它叫做上下文之后,我有可能帮到你。那这个实际上对应到 RAG。那如果用 RAG 也没有办法解决,那我们可能要去考虑第三个原因,有可能是我自身的能力不足。那这里就涉及到我的解决方案的能力需要有待提高,还有方法论也需要有待提高。所以这时候,我可能要反过来去提升我自己,因为基于现在的能力,即便你给我提供了很详细的相关的知识,让我弄清楚了这个问题本身,我可能也没有办法帮到你。所以等我提高我自己之后,我再反过来帮你,有可能可以给你一个正确的回复。那第三个,实际上对应到模型的微调,就是不要再去抱怨外部的环境,而是先重点提高自己。所以微调本身,也是对大模型本身的一个改造,但是一和二其实对大模型是没有做任何的改造的。所以在工程当中,我们的做事的方式也是从提示工程开始到 RAG,然后最后到模型的微调,不要一开始就要做微调,这个是在工程当中不可取的。

相关文章
|
机器学习/深度学习 自然语言处理
大语言模型(LLM)框架及微调 (Fine Tuning)
大语言模型(LLM)框架及微调 (Fine Tuning)
1164 0
|
机器学习/深度学习 人工智能 自然语言处理
什么是神经元、神经网络、模型、调参、炼丹?
什么是神经元、神经网络、模型、调参、炼丹?
1226 0
|
分布式计算 监控 搜索推荐
Elasticsearch之SearchScroll原理剖析和优化
Elasticsearch是一款优秀的开源企业级搜索引擎,其查询接口主要为Search接口,提供了丰富的各类查询、排序、统计聚合等功能。本文将要介绍的是另一个查询接口SearchScroll,同时介绍一下我们在这方面做的一些性能和稳定性等方面的优化工作。   Elasticsearch的SearchScroll接口可用于从索引中检索大量数据,或者是所有的数据,值得注意的是Elasti
5735 0
Elasticsearch之SearchScroll原理剖析和优化
|
Java 应用服务中间件
idea tomcat 404 无法自动打开本地项目war包路径
idea tomcat 404 无法自动打开本地项目war包路径
997 0
|
5月前
|
存储 机器学习/深度学习 人工智能
深度指南:智能体和大模型的核心差异 —— 定义、协作、商业场景全梳理
本文深入解析大模型与智能体的本质区别:大模型是具备强大理解与生成能力的“超级大脑”,而智能体是能自主感知、规划、行动的“全能助手”。二者在目标导向、系统架构、能力边界、交互方式和价值逻辑上存在根本差异。大模型侧重信息处理,智能体聚焦任务闭环;前者为后者提供核心引擎,后者让AI真正落地应用。通过电商、金融等案例可见,智能体正以全流程自动化推动企业效率革命,实现从“能力输出”到“价值创造”的跃迁。
3191 0
|
8月前
|
存储 人工智能 数据库
向量存储vs知识图谱:LLM记忆系统技术选型
本文探讨LLM长期记忆系统的构建难点与解决方案,对比向量检索与知识图谱架构优劣,分析Zep、Mem0、Letta等开源框架,并提供成本优化策略,助力开发者实现高效、可扩展的AI记忆系统。
874 3
向量存储vs知识图谱:LLM记忆系统技术选型
|
10月前
|
安全 Java Shell
Java模块化编程(JPMS)简介与实践
本文全面解析Java 9模块化系统(JPMS),帮助开发者解决JAR地狱、类路径冲突等常见问题,提升代码的封装性、性能与可维护性。内容涵盖模块化核心概念、module-info语法、模块声明、实战迁移、多模块项目构建、高级特性及最佳实践,同时提供常见问题和面试高频题解析,助你掌握Java模块化编程精髓,打造更健壮的应用。
|
10月前
|
敏捷开发 机器学习/深度学习 人工智能
需求重复、碎片化、无追溯?2025年智能化需求管理工具的关键应用
本文系统梳理需求管理工具从文档管理到AI驱动的四代技术演进,解析现代智能系统的核心功能架构与技术实现,并基于六维评估模型对比主流工具优劣。结合四阶段实施方法论与典型问题解决方案,为企业选型与落地提供全面指导。
442 0
解决java.lang.IllegalStateException: Failed to load ApplicationContext错误~
解决java.lang.IllegalStateException: Failed to load ApplicationContext错误~
1579 0
|
机器学习/深度学习 人工智能 搜索推荐
BioEmu:微软黑科技炸场!生成式AI重构蛋白质模拟:千倍效率碾压传统计算,新药研发周期砍半
BioEmu 是微软推出的生成式深度学习系统,可在单个 GPU 上每小时生成数千种蛋白质结构样本,支持模拟动态变化、预测热力学性质,并显著降低计算成本。
863 2
BioEmu:微软黑科技炸场!生成式AI重构蛋白质模拟:千倍效率碾压传统计算,新药研发周期砍半