【AI大模型应用开发】1.1 Prompt Engineering(提示词工程)- 用OpenAI API实战,优化方法论总结

简介: 【AI大模型应用开发】1.1 Prompt Engineering(提示词工程)- 用OpenAI API实战,优化方法论总结

书接上文 【AI大模型应用开发】1.0 Prompt Engineering(提示词工程)- 典型构成、原则与技巧,代码中加入Prompt,我们开始实战。

0. 从最简单的开始

0.1 通用代码封装

修改下我们上篇文章中的代码,将Prompt封装起来

from openai import OpenAI
# 加载 .env 到环境变量
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())
client = OpenAI()
###### 这里封装成函数 #######
def get_openai_chat_completion(messages, temperature, model = "gpt-3.5-turbo-1106"):
    response = client.chat.completions.create(
        model = model,
        messages = messages,
        temperature = temperature,
    )
    return response.choices[0].message.content

0.2 使用 - 从最简单的Prompt开始

if __name__ == "__main__":
    messages = [
        {
            "role": "user",
            "content": "你是谁?",
        }
    ]
    print(get_openai_chat_completion(messages, 0.8))
  • 回复(执行3次,3次回复均不同)
0.2.1 temperature参数测试
  • 更改temperature值为0,回复(执行3次,3次回复均相同)

temperature可以改变答案生成的随机性,约小,答案越固定。建议不要超过1。

0.2.2 加上System Prompt

前文我们知道prompt有三种角色:

  • system:系统指令,最重要,用于初始化GPT行为,以及规定GPT的角色、背景和后续行为模式。system是主提示,可以进行更加详细的设置。
  • user: 用户输入的信息。
  • assistant: 机器回复,由 API 根据 system 和 user 消息自动生成的。

assistant prompt通常由大模型回复生成,不需要自己设定。下面我们来加上System Prompt。

SYSTEM_PROMPT = """
你是一个Prompt优化器, 你叫同学小张,用户会给你一个提示,你根据用户给的提示,来将提示优化成更适合大模型的Prompt。
"""
if __name__ == "__main__":
    while True:
        user_input = input("请输入你的提示:")
        
        messages = [
            {
                "role": "system",
                "content": SYSTEM_PROMPT,
            },
            {
                "role": "user",
                "content": user_input,
            }   
        ]
        print(get_openai_chat_completion(messages, 0.5))

上面我们增加了System Prompt,给其指定了任务:帮助用户优化Prompt,并且名字叫【同学小张】。来看下它的回复:

可以看到System已经生效了,它充当了Prompt优化工具。虽然效果欠佳,但是是一个好的开始。下面我们将上篇文章总结的Prompt原则和技巧加进来,逐步迭代优化我们的这个Prompt。

1. 迭代优化Prompt

先把我们总结的Prompt典型构成和原则与技巧放进来:

1.1 提供清晰和具体的指令

1.1.1 使用分隔符指示输入的不同部分

不知道大家有没有发现,前面它回答名字出错了,它应该回答叫【同学小张】,但是它回答的却是【小张】。

  • 优化:将名字用分隔符隔出来,例如“”双引号。
SYSTEM_PROMPT = """
你是一个Prompt优化器, 你叫“同学小张”,用户会给你一个提示,你根据用户给的提示,来将提示优化成更适合大模型的Prompt。
"""
  • 看下效果还不错:

为了能更清晰的看出优化前后结果的好坏,下面我换了一个“规划学习大纲”的Prompt,优化空间更大。

  • 原始Prompt
SYSTEM_PROMPT = """
你叫“同学小张”,用户会给你一个提示,你根据用户给的提示,来为用户设计关于此课程的学习大纲。
"""
  • 原始结果

1.1.2 让模型充当某个角色

以上的结果虽然看起来像那么回事儿,但是仔细看来,更像是学一门知识的步骤,而不太像教程大纲。下面我们给Prompt加上角色。

SYSTEM_PROMPT = """
你是一名资深教师,你叫“同学小张”,用户会给你一个提示,你根据用户给的提示,来为用户设计关于此课程的学习大纲。
"""

结果明显更像是一个学习大纲,更成体系了。

1.1.2.1 为什么给大模型定义角色就能得到更好的结果?

有一篇论文研究表明:大模型对 prompt 开头和结尾的内容更敏感。

先定义角色,其实就是把大模型回复的问题域收窄,减少二义性,意思更清晰了。

1.1.3 告诉大模型我是谁 AND 给模型时间思考

如果我们已经学会了Python,不想让大模型给我们规划的大纲中包含这部分,我们可以作如下优化:

  • 在System Prompt中给模型时间思考,确保它理解了你想学的东西,这样可以减少幻觉。
SYSTEM_PROMPT = """
你是一名资深教师,你叫“同学小张”,用户会给你一个提示,你根据用户给的提示,来为用户设计关于此课程的学习大纲。
你必须遵循以下原则:
1. 你有足够的时间思考,确保在得出答案之前,你已经足够理解用户需求中的所有关键概念,并给出关键概念的解释。
"""
  • 用户输入中加入“我已经学会了Python语言”,告诉大模型我是谁
我想学习Prompt,我已经学会了Python语言

结果如下,可以看到大纲中已经没有了Python的基础部分。

1.1.4 输出内容约束

指定输出格式为MarkDown格式,并要求至少是10小节的大纲

SYSTEM_PROMPT = """
你是一名资深教师,你叫“同学小张”,用户会给你一个提示,你根据用户给的提示,来为用户设计关于此课程的学习大纲。
你必须遵循以下原则:
1. 你有足够的时间思考,确保在得出答案之前,你已经足够理解用户需求中的所有关键概念,并给出关键概念的解释。
2. 输出格式请使用Markdown格式,并保证输出内容清晰易懂。
3. 至少输出10小节的内容
"""

结果如下(没截全,确实是10小节)。

但是每小节内容有点不规范,于是再次优化:

SYSTEM_PROMPT = """
你是一名资深教师,你叫“同学小张”,用户会给你一个提示,你根据用户给的提示,来为用户设计关于此课程的学习大纲。
你必须遵循以下原则:
1. 你有足够的时间思考,确保在得出答案之前,你已经足够理解用户需求中的所有关键概念,并给出关键概念的解释。
2. 输出格式请使用Markdown格式,并保证输出内容清晰易懂。
3. 至少输出10章的内容,每章至少有5个小节
"""

要求它输出至少10章内容,每章至少5小节,结果如下(越来越像样子了):

好了,篇幅所限,迭代优化演示就到这里了,Prompt就是这样从最简单的开始,一步一步优化成可以满足自己要求的。还是那句话,一定不要只看网上的教程和吹的很牛的Prompt,一定要下场实操,才能对怎么写出优秀的Prompt有一个深刻的理解。

2. Prompt优化方法论(进阶技巧)

2.1 进阶技巧汇总

2.2 实战举例 - 少样本提示

这里我拿之前我通过Prompt让ChatGPT帮我写代码的例子来看:

这是一个很直观的例子,如果你不告诉它文件里数据的结构,不举个例子告诉它哪些是x坐标,哪些是y坐标,它肯定不会得到正确的结果。

其余的进阶技巧就不一一实战和演示了,没有具体的需求,没碰到具体的事儿,确实不好找例子来演示。等以后遇到了再补上吧。目前先有个大体认识,知道有这么个方法论,以后遇到难题能作为一种解决思路吧。

意犹未尽的同学可以参考这篇文章:提示工程指南,里面总结的很详细。

3. 加一句Prompt,让你的Prompt效果翻倍

本文最后,给大家搜集了几个常用咒语,加上它,大概率让你的Prompt效果翻倍。

  1. Let’s think step by step(让我们一步一步思考)- 其实就是上文中的思维链
  2. Please provide a detailed explanation(请提供详细解释)
  3. Can you break it down into simpler terms?(你能用更简单的术语解释吗?)
  4. Please list the pros and cons(请列出优缺点)
  5. Can you provide a step-by-step guide?(你能提供一步一步的指导吗?)

从今天开始,持续学习,开始搞事情。踩坑不易,欢迎关注我,围观我!

本站文章一览:

有任何问题,欢迎+vx:jasper_8017,我也是个小白,期待与志同道合的朋友一起讨论,共同进步!

相关文章
|
2月前
|
人工智能 JSON 自然语言处理
基于阿里云通义千问的AI模型应用开发指南
阿里云通义千问是阿里巴巴集团推出的多模态大语言模型平台,提供了丰富的API和接口,支持多种AI应用场景,如文本生成、图像生成和对话交互等。本文将详细介绍阿里云通义千问的产品功能,并展示如何使用其API来构建一个简单的AI应用,包括程序代码和具体操作流程,以帮助开发者快速上手。
707 3
|
10天前
|
人工智能 数据管理 API
阿里云百炼又获大奖!阿里云百炼入选 2024 最受开发者欢迎的 AI 应用开发平台榜15强
2024年最受开发者欢迎的AI应用开发平台榜单发布,阿里云百炼入选15强。持续推动AI开发者生态建设,提供开放平台、培训支持、行业解决方案,注重数据安全与合规,致力于生态合作与共赢,加速企业数智化转型。
|
2月前
|
存储 人工智能 uml
介绍一款好用的开源画图神器-draw.io | AI应用开发
draw.io 是一款基于浏览器的开源绘图工具,无需安装即可使用,支持多种操作系统和设备。其简洁的界面、丰富的形状库、智能对齐功能和强大的云端协作能力,使其成为专业人士和创意爱好者的首选。无论是产品设计、流程图绘制还是思维导图构建,draw.io 都能满足你的多样化需求。【10月更文挑战第7天】
234 0
|
2月前
|
人工智能 Python
读取excel工具:openpyxl | AI应用开发
`openpyxl` 是一个 Python 库,专门用于读写 Excel 2010 xlsx/xlsm/xltx/xltm 文件。它是处理 Excel 文件的强大工具,可以让你在不需要安装 Excel 软件的情况下,对 Excel 文件进行创建、修改、读取和写入操作【10月更文挑战第3天】
95 0
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
智谱AI推出的GLM-4V-Flash是一款专注于图像理解的免费开放大模型,提供API接口支持用户上传图片URL或Base64编码图片获取详细的图像描述。该模型通过深度学习和卷积神经网络技术,简化了图像分析流程,提高了开发效率,适用于内容审核、辅助视障人士、社交媒体、教育和电子商务等多个应用场景。
84 14
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
|
2月前
|
存储 人工智能 分布式计算
Parquet 文件格式详解与实战 | AI应用开发
Parquet 是一种列式存储文件格式,专为大规模数据处理设计,广泛应用于 Hadoop 生态系统及其他大数据平台。本文介绍 Parquet 的特点和作用,并演示如何在 Python 中使用 Pandas 库生成和读取 Parquet 文件,包括环境准备、生成和读取文件的具体步骤。【10月更文挑战第13天】
388 60
|
23天前
|
机器学习/深度学习 人工智能 算法
从 OpenAI-o1 看大模型的复杂推理能力
深入解析OpenAI o1模型的复杂推理技术与发展历程
|
29天前
|
人工智能 Java API
ChatClient:探索与AI模型通信的Fluent API
【11月更文挑战第22天】随着人工智能(AI)技术的飞速发展,越来越多的应用场景开始融入AI技术以提升用户体验和系统效率。在Java开发中,与AI模型通信成为了一个重要而常见的需求。为了满足这一需求,Spring AI引入了ChatClient,一个提供流畅API(Fluent API)的客户端,用于与各种AI模型进行通信。本文将深入探讨ChatClient的底层原理、业务场景、概念、功能点,并通过Java代码示例展示如何使用Fluent API与AI模型进行通信。
46 8
|
1月前
|
前端开发 JavaScript API
探究 React Hooks:如何利用全新 API 优化组件逻辑复用与状态管理
本文深入探讨React Hooks的使用方法,通过全新API优化组件逻辑复用和状态管理,提升开发效率和代码可维护性。
|
2月前
|
人工智能 Java API
阿里云开源 AI 应用开发框架:Spring AI Alibaba
近期,阿里云重磅发布了首款面向 Java 开发者的开源 AI 应用开发框架:Spring AI Alibaba(项目 Github 仓库地址:alibaba/spring-ai-alibaba),Spring AI Alibaba 项目基于 Spring AI 构建,是阿里云通义系列模型及服务在 Java AI 应用开发领域的最佳实践,提供高层次的 AI API 抽象与云原生基础设施集成方案,帮助开发者快速构建 AI 应用。本文将详细介绍 Spring AI Alibaba 的核心特性,并通过「智能机票助手」的示例直观的展示 Spring AI Alibaba 开发 AI 应用的便利性。示例源
1263 11
下一篇
DataWorks