吴恩达 x Open AI ChatGPT ——如何写出好的提示词视频核心笔记

简介: 吴恩达 x Open AI ChatGPT ——如何写出好的提示词视频核心笔记

核心知识点脑图如下:

1、第一讲:课程介绍

  • 要点1:

上图展示了两种大型语言模型(LLMs)的对比:基础语言模型(Base LLM)和指令调整语言模型(Instruction Tuned LLM)。

基础语言模型(Base LLM)

功能:基础语言模型能够预测下一个单词,这种预测是基于文本训练数据。

例子:图中提供了一个故事的开头:“Once upon a time, there was a unicorn that lived in a magical forest with all her unicorn friends(中文释义:从前,有一只独角兽和她所有的独角兽朋友住在魔法森林里)”,这展示了模型如何根据给定的文本继续生成故事。问答能力:它能够回答基础的问题,例如“法国的首都是什么?”,但它可能会产生问题文本,如有害输出,这些输出与基础语言模型的性质有关,因为它们仅基于预测下一个最可能的单词,而不是遵循特定的指令。

指令调整语言模型(Instruction Tuned LLM)

  • 功能:这种模型试图遵循指令,它通过在指令上进行微调(fine-tuning,周鸿祎大佬经常讲),并在尝试遵循这些指令时进行优化。
  • 微调方法:使用RLHF(Reinforcement Learning with Human Feedback,中文释义:人类反馈强化学习)进行微调,即结合强化学习和人类反馈。

  • 三H原则:帮助(Helpful)、诚实(Honest)、无害(Harmless)。

例子:当问到“法国的首都是什么?”时,指令调整的模型会更准确地回答“法国的首都是巴黎”。

总结来说,图中的主要区别在于基础模型侧重于文本数据的下一个词预测,而指令调整模型则侧重于理解和遵循指令,提供更准确、更有用、更安全的输出。

2、第二讲:使用准则

  • 要点1:好提示词的第一个原则——写出清晰且准确的提示

指令必须清晰的三个核心原因:

核心一——避免歧义:清晰的指令让机器没有猜测的空间,可以直接执行。

核心二——提高效率:清晰的指令可以让机器快速理解并采取行动,节约时间。

核心三——确保结果准确:指令清晰可以确保机器提供的结果是我们所期待的。

  • 要点2:好提示词的第一个原则——给大模型思考的时间

要点2所说的“给大模型思考的时间”,其实是在指导我们如何更高效地与大型语言模型(如我)进行交互。

下面是三个核心要点的解读:

(1)等待模型回应:

模型需要时间处理你的请求和生成回答,就像你向朋友提问后要等待他们思考并回答一样。

(2)避免打断:

在模型回答之前不要急于提出新问题,这就像不打断别人说话,给对方完成表达的机会。

这个一般模型也不允许。

(3)逐步提问

如果有复杂的问题,可以分步骤提问,让模型逐一解决,就像解难题一样,一步一个脚印来解答。

这是最核心的,大问题务必精准拆解成小问题,且根据回复逐步调优

3、第三讲:提示词不是一步到位的,而通过反复迭代逐步完善的。

吴恩达老师“这幅图展示了一个名为“迭代式提示开发”的循环流程图,它代表一个反馈循环,用于改进和完善提示(可能是编程、数据输入或任何需要精确指示的场合)的质量。流程由四个主要部分组成:

1、Idea(想法): 这是流程的开始阶段,你需要有一个初始想法或设计,这将成为你的起始点。

2、Implementation (code/data) Prompt(实现(代码/数据)提示): 根据想法,你会创建一个初步的提示,如果是编程领域,可能是编写代码或准备数据输入。

3、Experimental result(实验结果): 使用你的提示进行实验后,你将获得某些结果,这些结果可能会或不会符合你的预期。

4、Error Analysis(错误分析): 如果结果不符合预期,你需要进行错误分析,查找为什么会出现这样的结果,可能是提示不够清晰、具体或存在逻辑错误。

这个过程是迭代的,意味着你会不断重复这个循环,每一次都根据之前的反馈来调整和改进你的提示,直到实验结果符合你的预期。

图下方的“Prompt guidelines”列出了优化提示时应遵循的指导原则:

1、Be clear and specific(要清晰和具体): 提示需要有足够的详细信息,避免歧义——这点反复强调过了。

2、Analyze why result does not give desired output(分析为什么结果不符合预期输出): 当结果不如意时,深入分析原因(模型会分析,咱们也不要坐等,要结合经验进行分析),理解导致结果偏差的因素。

3、Refine the idea and the prompt(改进想法和提示): 根据分析结果调整你的想法和提示。

4、Repeat(重复): 不断重复这一过程(反复迭代),每次都尝试提高提示的有效性。

这个流程是设计思维和敏捷开发的典型,强调持续改进和适应性。

4、第四讲:最兴奋的功能——文本总结

为大段文本形成摘要,以便我们快速的获取信息。

新版GPT4最多能让用户输入3万2千token(大概50页英文文字长度,网上说法大约25000字)。

5、第五讲:模型推理:

省去了早期开发需要自己训练模型的工作,现在一个API搞定!

6、第六讲:格式转化 Transforming

  • Html 转 JSON等各种转换:原来咱们用复杂的正则,现在大模型API快速搞定。
  • 校对写的所有内容:论文、评论、文稿等。
  • 支持各种语言的翻译
  • GPT4 的图片转文本,文本转图片功能也非常强大。

7、第7讲:文本扩写

  • Chatgpt可以作为头脑风暴的伙伴,基于我们的提示词展开文本扩写。
  • 建议负责任的使用,比如:不要生成垃圾邮件。
  • 可用于文档助理,比如:邮件助理。

8、第8讲:自定义聊天机器人

用途举例:

  • AI 客服助理;
  • 餐厅AI接单员

等等......

注意:角色的设定很重要。

9、小结

9.1 写出好的提示词的两个核心要点

  • 1、写出清晰和具体指令的重要性
  • 2、给予模型足够的时间来“思考”。

9.2 迭代式提示开发

这是一种通过不断优化和细化提示来改进模型响应的方法。

9.3 模型的几项能力

  • 总结
  • 推断
  • 转换
  • 扩展信息。

这些能力在构建聊天机器人时尤为重要,它们使得机器人能够处理各种任务,从理解和回应用户输入到生成新的内容。

模型非常有趣,可以放心去玩!!——咱们就是得多用,才能知道怎么更好得使用用!

10、中英文字母视频地址

https://www.bilibili.com/video/BV1s24y1F7eq


相关文章
|
20天前
|
人工智能 测试技术 计算机视觉
让AI看懂3小时长视频!Eagle 2.5:英伟达推出8B视觉语言模型,长视频理解能力碾压72B大模型
Eagle 2.5是英伟达推出的8B参数视觉语言模型,通过创新训练策略在长视频和高分辨率图像理解任务中超越更大规模模型,支持512帧视频输入和多样化多模态任务。
131 10
让AI看懂3小时长视频!Eagle 2.5:英伟达推出8B视觉语言模型,长视频理解能力碾压72B大模型
|
20天前
|
机器学习/深度学习 人工智能 自动驾驶
让AI看懂图像每个像素!英伟达推出多模态大模型 DAM-3B:图像视频局部描述精度提升300%
英伟达推出的DAM-3B多模态大语言模型,通过创新的焦点提示技术和局部视觉骨干网络,实现了对图像和视频中特定区域的精准描述生成,为内容创作和智能交互领域带来全新可能。
137 0
让AI看懂图像每个像素!英伟达推出多模态大模型 DAM-3B:图像视频局部描述精度提升300%
|
9天前
|
人工智能 API 开发者
用Qwen3+MCPs实现AI自动发布小红书笔记!支持图文和视频
魔搭自动发布小红书MCP,是魔搭开发者小伙伴实现的小红书笔记自动发布器,可以通过这个MCP自动完成小红书标题、内容和图片的发布。
331 29
|
19天前
|
Web App开发 人工智能 自然语言处理
Open Avatar Chat:阿里开源实时数字人对话系统,让AI对话实现2.2秒低延迟交互
Open Avatar Chat是阿里开源的模块化数字人对话系统,支持文本/音频/视频多模态交互,采用可替换组件设计,平均响应延迟仅2.2秒,为开发者提供灵活高效的解决方案。
420 3
Open Avatar Chat:阿里开源实时数字人对话系统,让AI对话实现2.2秒低延迟交互
|
9天前
|
人工智能
我说魔,你说搭-魔搭AI视频宣传片挑战赛
当大家都喊魔塔的时候,我们决定搞个事情...有人管咱们叫"魔塔"?
60 4
|
7天前
|
Web App开发 人工智能 JSON
Windows版来啦!Qwen3+MCPs,用AI自动发布小红书图文/视频笔记!
上一篇用 Qwen3+MCPs实现AI自动发小红书的最佳实践 有超多小伙伴关注,同时也排队在蹲Windows版本的教程。
142 1
|
20天前
|
机器学习/深度学习 人工智能 编解码
OpenAI 最新多模态图像生成模型 GPT-image-1:一句话生成商业图+智能修图
GPT-image-1是OpenAI推出的新一代多模态图像生成模型,通过API提供专业级图像生成与编辑能力,支持多种分辨率、格式和艺术风格定制。
133 10
OpenAI 最新多模态图像生成模型 GPT-image-1:一句话生成商业图+智能修图
|
5月前
|
Go 开发工具
百炼-千问模型通过openai接口构建assistant 等 go语言
由于阿里百炼平台通义千问大模型没有完善的go语言兼容openapi示例,并且官方答复assistant是不兼容openapi sdk的。 实际使用中发现是能够支持的,所以自己写了一个demo test示例,给大家做一个参考。
|
2月前
|
机器学习/深度学习 人工智能 开发者
GPT-4o-mini-transcribe:OpenAI 推出实时语音秒转文本模型!高性价比每分钟0.003美元
GPT-4o-mini-transcribe 是 OpenAI 推出的语音转文本模型,基于 GPT-4o-mini 架构,采用知识蒸馏技术,适合在资源受限的设备上运行,具有高效、实时和高性价比的特点。
103 2
GPT-4o-mini-transcribe:OpenAI 推出实时语音秒转文本模型!高性价比每分钟0.003美元
|
2月前
|
人工智能 自然语言处理 语音技术
GPT-4o mini TTS:OpenAI 推出轻量级文本转语音模型!情感操控+白菜价冲击配音圈
GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型,支持多语言、多情感控制,适用于智能客服、教育学习、智能助手等多种场景。
135 2
GPT-4o mini TTS:OpenAI 推出轻量级文本转语音模型!情感操控+白菜价冲击配音圈