【AI大模型应用开发】1.1 Prompt Engineering(提示词工程)- 用OpenAI API实战,优化方法论总结

简介: 【AI大模型应用开发】1.1 Prompt Engineering(提示词工程)- 用OpenAI API实战,优化方法论总结

书接上文 【AI大模型应用开发】1.0 Prompt Engineering(提示词工程)- 典型构成、原则与技巧,代码中加入Prompt,我们开始实战。

0. 从最简单的开始

0.1 通用代码封装

修改下我们上篇文章中的代码,将Prompt封装起来

from openai import OpenAI
# 加载 .env 到环境变量
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())
client = OpenAI()
###### 这里封装成函数 #######
def get_openai_chat_completion(messages, temperature, model = "gpt-3.5-turbo-1106"):
    response = client.chat.completions.create(
        model = model,
        messages = messages,
        temperature = temperature,
    )
    return response.choices[0].message.content

0.2 使用 - 从最简单的Prompt开始

if __name__ == "__main__":
    messages = [
        {
            "role": "user",
            "content": "你是谁?",
        }
    ]
    print(get_openai_chat_completion(messages, 0.8))
  • 回复(执行3次,3次回复均不同)
0.2.1 temperature参数测试
  • 更改temperature值为0,回复(执行3次,3次回复均相同)

temperature可以改变答案生成的随机性,约小,答案越固定。建议不要超过1。

0.2.2 加上System Prompt

前文我们知道prompt有三种角色:

  • system:系统指令,最重要,用于初始化GPT行为,以及规定GPT的角色、背景和后续行为模式。system是主提示,可以进行更加详细的设置。
  • user: 用户输入的信息。
  • assistant: 机器回复,由 API 根据 system 和 user 消息自动生成的。

assistant prompt通常由大模型回复生成,不需要自己设定。下面我们来加上System Prompt。

SYSTEM_PROMPT = """
你是一个Prompt优化器, 你叫同学小张,用户会给你一个提示,你根据用户给的提示,来将提示优化成更适合大模型的Prompt。
"""
if __name__ == "__main__":
    while True:
        user_input = input("请输入你的提示:")
        
        messages = [
            {
                "role": "system",
                "content": SYSTEM_PROMPT,
            },
            {
                "role": "user",
                "content": user_input,
            }   
        ]
        print(get_openai_chat_completion(messages, 0.5))

上面我们增加了System Prompt,给其指定了任务:帮助用户优化Prompt,并且名字叫【同学小张】。来看下它的回复:

可以看到System已经生效了,它充当了Prompt优化工具。虽然效果欠佳,但是是一个好的开始。下面我们将上篇文章总结的Prompt原则和技巧加进来,逐步迭代优化我们的这个Prompt。

1. 迭代优化Prompt

先把我们总结的Prompt典型构成和原则与技巧放进来:

1.1 提供清晰和具体的指令

1.1.1 使用分隔符指示输入的不同部分

不知道大家有没有发现,前面它回答名字出错了,它应该回答叫【同学小张】,但是它回答的却是【小张】。

  • 优化:将名字用分隔符隔出来,例如“”双引号。
SYSTEM_PROMPT = """
你是一个Prompt优化器, 你叫“同学小张”,用户会给你一个提示,你根据用户给的提示,来将提示优化成更适合大模型的Prompt。
"""
  • 看下效果还不错:

为了能更清晰的看出优化前后结果的好坏,下面我换了一个“规划学习大纲”的Prompt,优化空间更大。

  • 原始Prompt
SYSTEM_PROMPT = """
你叫“同学小张”,用户会给你一个提示,你根据用户给的提示,来为用户设计关于此课程的学习大纲。
"""
  • 原始结果

1.1.2 让模型充当某个角色

以上的结果虽然看起来像那么回事儿,但是仔细看来,更像是学一门知识的步骤,而不太像教程大纲。下面我们给Prompt加上角色。

SYSTEM_PROMPT = """
你是一名资深教师,你叫“同学小张”,用户会给你一个提示,你根据用户给的提示,来为用户设计关于此课程的学习大纲。
"""

结果明显更像是一个学习大纲,更成体系了。

1.1.2.1 为什么给大模型定义角色就能得到更好的结果?

有一篇论文研究表明:大模型对 prompt 开头和结尾的内容更敏感。

先定义角色,其实就是把大模型回复的问题域收窄,减少二义性,意思更清晰了。

1.1.3 告诉大模型我是谁 AND 给模型时间思考

如果我们已经学会了Python,不想让大模型给我们规划的大纲中包含这部分,我们可以作如下优化:

  • 在System Prompt中给模型时间思考,确保它理解了你想学的东西,这样可以减少幻觉。
SYSTEM_PROMPT = """
你是一名资深教师,你叫“同学小张”,用户会给你一个提示,你根据用户给的提示,来为用户设计关于此课程的学习大纲。
你必须遵循以下原则:
1. 你有足够的时间思考,确保在得出答案之前,你已经足够理解用户需求中的所有关键概念,并给出关键概念的解释。
"""
  • 用户输入中加入“我已经学会了Python语言”,告诉大模型我是谁
我想学习Prompt,我已经学会了Python语言

结果如下,可以看到大纲中已经没有了Python的基础部分。

1.1.4 输出内容约束

指定输出格式为MarkDown格式,并要求至少是10小节的大纲

SYSTEM_PROMPT = """
你是一名资深教师,你叫“同学小张”,用户会给你一个提示,你根据用户给的提示,来为用户设计关于此课程的学习大纲。
你必须遵循以下原则:
1. 你有足够的时间思考,确保在得出答案之前,你已经足够理解用户需求中的所有关键概念,并给出关键概念的解释。
2. 输出格式请使用Markdown格式,并保证输出内容清晰易懂。
3. 至少输出10小节的内容
"""

结果如下(没截全,确实是10小节)。

但是每小节内容有点不规范,于是再次优化:

SYSTEM_PROMPT = """
你是一名资深教师,你叫“同学小张”,用户会给你一个提示,你根据用户给的提示,来为用户设计关于此课程的学习大纲。
你必须遵循以下原则:
1. 你有足够的时间思考,确保在得出答案之前,你已经足够理解用户需求中的所有关键概念,并给出关键概念的解释。
2. 输出格式请使用Markdown格式,并保证输出内容清晰易懂。
3. 至少输出10章的内容,每章至少有5个小节
"""

要求它输出至少10章内容,每章至少5小节,结果如下(越来越像样子了):

好了,篇幅所限,迭代优化演示就到这里了,Prompt就是这样从最简单的开始,一步一步优化成可以满足自己要求的。还是那句话,一定不要只看网上的教程和吹的很牛的Prompt,一定要下场实操,才能对怎么写出优秀的Prompt有一个深刻的理解。

2. Prompt优化方法论(进阶技巧)

2.1 进阶技巧汇总

2.2 实战举例 - 少样本提示

这里我拿之前我通过Prompt让ChatGPT帮我写代码的例子来看:

这是一个很直观的例子,如果你不告诉它文件里数据的结构,不举个例子告诉它哪些是x坐标,哪些是y坐标,它肯定不会得到正确的结果。

其余的进阶技巧就不一一实战和演示了,没有具体的需求,没碰到具体的事儿,确实不好找例子来演示。等以后遇到了再补上吧。目前先有个大体认识,知道有这么个方法论,以后遇到难题能作为一种解决思路吧。

意犹未尽的同学可以参考这篇文章:提示工程指南,里面总结的很详细。

3. 加一句Prompt,让你的Prompt效果翻倍

本文最后,给大家搜集了几个常用咒语,加上它,大概率让你的Prompt效果翻倍。

  1. Let’s think step by step(让我们一步一步思考)- 其实就是上文中的思维链
  2. Please provide a detailed explanation(请提供详细解释)
  3. Can you break it down into simpler terms?(你能用更简单的术语解释吗?)
  4. Please list the pros and cons(请列出优缺点)
  5. Can you provide a step-by-step guide?(你能提供一步一步的指导吗?)

从今天开始,持续学习,开始搞事情。踩坑不易,欢迎关注我,围观我!

本站文章一览:

有任何问题,欢迎+vx:jasper_8017,我也是个小白,期待与志同道合的朋友一起讨论,共同进步!

相关文章
|
6天前
|
机器学习/深度学习 人工智能
打开AI黑匣子,三段式AI用于化学研究,优化分子同时产生新化学知识,登Nature
【10月更文挑战第11天】《自然》杂志发表了一项突破性的化学研究,介绍了一种名为“Closed-loop transfer”的AI技术。该技术通过数据生成、模型训练和实验验证三个阶段,不仅优化了分子结构,提高了光稳定性等性质,还发现了新的化学现象,为化学研究提供了新思路。此技术的应用加速了新材料的开发,展示了AI在解决复杂科学问题上的巨大潜力。
12 1
|
7天前
|
存储 人工智能 uml
介绍一款好用的开源画图神器-draw.io | AI应用开发
draw.io 是一款基于浏览器的开源绘图工具,无需安装即可使用,支持多种操作系统和设备。其简洁的界面、丰富的形状库、智能对齐功能和强大的云端协作能力,使其成为专业人士和创意爱好者的首选。无论是产品设计、流程图绘制还是思维导图构建,draw.io 都能满足你的多样化需求。【10月更文挑战第7天】
41 0
|
11天前
|
人工智能 Python
读取excel工具:openpyxl | AI应用开发
`openpyxl` 是一个 Python 库,专门用于读写 Excel 2010 xlsx/xlsm/xltx/xltm 文件。它是处理 Excel 文件的强大工具,可以让你在不需要安装 Excel 软件的情况下,对 Excel 文件进行创建、修改、读取和写入操作【10月更文挑战第3天】
45 0
|
23小时前
|
存储 人工智能 自然语言处理
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
|
5天前
|
人工智能 Java API
阿里云开源 AI 应用开发框架:Spring AI Alibaba
近期,阿里云重磅发布了首款面向 Java 开发者的开源 AI 应用开发框架:Spring AI Alibaba(项目 Github 仓库地址:alibaba/spring-ai-alibaba),Spring AI Alibaba 项目基于 Spring AI 构建,是阿里云通义系列模型及服务在 Java AI 应用开发领域的最佳实践,提供高层次的 AI API 抽象与云原生基础设施集成方案,帮助开发者快速构建 AI 应用。本文将详细介绍 Spring AI Alibaba 的核心特性,并通过「智能机票助手」的示例直观的展示 Spring AI Alibaba 开发 AI 应用的便利性。示例源
|
7天前
|
前端开发 API
Context API 实战应用
【10月更文挑战第8天】在 React 应用开发中,状态管理至关重要。本文介绍了 `Context API` 的基础概念、基本用法,以及常见问题和易错点的解决方法。通过代码示例,详细讲解了如何在组件间高效共享状态,优化性能,处理嵌套 Context 和副作用。
10 1
|
10天前
|
人工智能 Java API
阿里云开源 AI 应用开发框架:Spring AI Alibaba
阿里云开源 Spring AI Alibaba,旨在帮助 Java 开发者快速构建 AI 应用,共同构建物理新世界。
|
12天前
|
人工智能 开发者 Python
python读取word文档 | AI应用开发
在RAG系统中,构建知识库时需读取多种外部文档,其中Word文档较为常见。本文介绍如何使用`python-docx`库读取Word文档(.docx格式)中的标题、段落、表格和图片等内容。首先通过`pip install python-docx`安装库,然后利用提供的接口提取所需信息。尽管该库功能强大,但在识别标题样式时需自定义逻辑,并且仅提供图片的URI而非直接加载。示例代码展示了读取文本、识别标题、读取表格及获取图片URI的方法。【10月更文挑战第2天】
31 2
|
12天前
|
数据采集 人工智能 测试技术
还在死磕AI咒语?北大-百川搞了个自动提示工程系统PAS
【10月更文挑战第4天】北京大学和百川智能研究人员开发了一种名为PAS的即插即用自动提示工程(APE)系统,利用高质量数据集训练的大型语言模型(LLMs),在基准测试中取得了显著成果,平均提升了6.09个百分点。PAS仅需9000个数据点即可实现顶尖性能,并能自主生成提示增强数据,提高了灵活性和效率。尽管存在训练数据质量和提示多样性等方面的潜在局限性,PAS仍为解决提示工程挑战提供了有前景的方法,有望提升LLM的可用性和有效性。论文详见:https://arxiv.org/abs/2407.06027。
31 3
|
4天前
|
人工智能 运维 Serverless
Serverless + AI 让应用开发更简单
随着云计算和人工智能(AI)技术的飞速发展,企业对于高效、灵活且成本效益高的解决方案的需求日益增长。本文旨在探讨 Serverless 架构与 AI 技术的结合,如何通过 Serverless 函数计算和 AI 开发平台,助力企业简化应用开发流程,减少企业 AI 业务试错成本,加速业务创新,为企业业务发展提供无限可能。