Agent 从想法到实现之六顶思考帽

简介: 本文简要介绍六顶思考帽的概念及其优势,讲解智能体的概念和智能体平台,讲解该智能体的创建过程,带领大家从想法走向实现。

一、背景

最近,听了一场关于“六顶思考帽”的专题讲座,深刻感受到这一思维工具在帮助我们进行更全面系统的思考方面所具有的巨大潜力。


坦白说,早在很久之前我就接触过“六顶思考帽”的概念,但由于其“使用成本”较高,一直未能在我的日常生活中广泛应用。首先,需在恰当的场景下想到使用这一工具;其次,应用时需从六个不同的角度进行分析,这不仅费时费力,而且即便这六个角度能够帮助我们更全面地思考问题,每个角度的深入思考仍然需要消耗大量精力。


然而,随着人工智能时代的到来,我开始尝试利用 AI 创建各种智能体,以提高生活、学习和工作的效率。因此,我产生了一个新想法——为何不开发一个“六顶思考帽助手”智能体呢?


如果有一个智能体能够以极低的成本充分发挥“六顶思考帽”的价值,我会更愿意在日常生活中频繁使用它,这将大大提升我在思考问题时的全面性。


接下来,我将简要介绍六顶思考帽的概念及其优势,讲解智能体的概念和常见的智能体平台,讲解该智能体的创建过程,带领大家从想法走向实现。


二、六顶思考帽介绍

2.1 概念

六顶思考帽(Six Thinking Hats)是由爱德华·德·博诺(Edward de Bono)提出的一种系统化思维工具,旨在帮助个人和团队更有条理地进行思考与决策。

image.png

每顶“帽子”代表一种特定的思考方式,鼓励人们从不同角度分析和处理问题:

  1. 白帽:专注于客观的事实和数据,分析现有的信息。
  2. 红帽:代表情感和直觉,表达个人的感受和情绪。
  3. 黑帽:用于批判性思考,找出潜在的问题和风险。
  4. 黄帽:象征乐观,寻找问题中的积极面和机会。
  5. 绿帽:代表创造性思维,鼓励提出新的想法和解决方案。
  6. 蓝帽:负责组织和控制思考过程,确保思考有序进行。

通过依次“戴上”不同的思考帽,人们能够从多角度全方位审视问题,从而实现更加全面和均衡的决策。


2.2 好处

使用六顶思考帽思维工具可以带来多方面的优势:


1. 结构化思维:六顶思考帽提供了一种系统化的思考方式,使得讨论和决策过程更加有条理,避免思维混乱。


2. 全方位考虑问题:通过分别从不同的角度(事实、情感、乐观、悲观、创造性、控制)来思考问题,可以确保问题得到全面的分析,避免片面性。


3. 提高决策质量:因为每个思维帽子都有明确的思考方向,可以帮助团队在决策时更深入、更全面地分析,从而得出更高质量的决策。


4. 促进团队协作:在团队中使用六顶思考帽时,每个人都可以明确自己的思考角色,这有助于团队成员各司其职,减少争论,增加协作效率。


5. 减少情绪干扰:通过将情绪(红帽)与事实(白帽)分开,可以有效减少情绪对决策过程的负面影响,从而使得讨论更加客观、公正。


6. 鼓励创新:黄帽和绿帽的使用可以激发团队的创造力和正向思考,鼓励提出新颖的、创造性的解决方案。


7. 改进沟通:六顶思考帽方法可以帮助团队成员更好地理解彼此的思考方式,减少误解,从而改进沟通效果。


8. 灵活应用:六顶思考帽可以应用于个人思考、团队讨论、战略规划、问题解决等多个领域,具有很强的灵活性和实用性。


三、Agent 介绍

3.1 概念

《真格基金戴雨森谈生成式AI:这是比移动互联网更大的创业机会,开始行动是关键 》 一文对Tool、Chatbot、Copilot、Agent 和 Intelligence 进行了清晰的概念划分。

image.png

文中提到,Agent(智能体)级别的AI已经能够完成绝大部分工作。此时,人类的主要职责是设定目标、提供资源以及监督结果,而AI则承担了任务的分配、工具的选择、进度的控制,并且自主实现目标的能力显著提升。这类应用的代表是 AutoGPT,它展示了 AI 在执行复杂任务中的潜力。Agent 级别的 AI 接近通用人工智能(AGI),未来有望承担更多复杂的工作。


3.2 平台

目前,尽管已经有许多智能体构建平台,但大多数平台的智能体仍更类似于支持预定义提示词的 Chatbot,与理想中的 Agent 形态仍存在一定差距。

请大家不必纠结 Chatbot 和 Agent 的叫法。现在很多平台对两者没有明确区分。

常见的 Chatbot 或 Agent 构建平台有很多,比如:

image.png

通义千问支持通过创意工作室、基础模板和自由创建的方式来创建智能体。支持设置开场白、灵感、技能和通过文件的方式上传知识等高级设置。

image.png

Dify 平台强调其生产就绪性和完整解决方案,类似于 LangChain 的高级工具箱。Dify 还提供开源支持,允许用户自行部署类似 Assistants API 和 GPT 的能力,确保数据的灵活性和安全性,同时在易于使用的界面中实现全面控制。


这些平台各具特色,用户可以根据自身需求和偏好选择最合适的智能体构建平台。


四、Agent 创建过程

接下来,我们以通义千问的智能体为例,简要演示如何创建一个“六顶思维帽”智能体。

image.png

目前,通义千问智能体支持创意工作室、基础模板和自由创建多种创建方式,大家可以选择自己最喜欢的方式进行创建。


4.1 小试牛刀

创建智能体时,可以自己提供头像,也可以 AI 生成。如果想要自己提供头像可以通过  https://www.iconfont.cn/ 等图标平台搜索使用。

image.png

提示词可以尝试自己编写,也可以使用「一键生成」。我个人比较喜欢个性化的提示词,通常会优先自己编写提示词。

下面是第一版提示词,我明确了任务,该提示词简单明了。

## 技能
请根据“六顶思考帽”相关知识,分别用  6 顶思考帽对问题进行分析和提供建议。

说明:有些同学担心模型不懂“六顶思维帽”的概念,可能会将“六顶思维帽”的概念放在提示词里。其实对于常见知识,模型一般都懂,不需要将六顶思维帽的知识放在提示词。

image.png

我们可以发现,效果基本符合预期,但仍有一些不足。


4.2 调试改进

在初次调试后,我发现了以下问题:

  • 模型未必每次都会在帽名称后带上每种帽子的含义,这容易对我们理解造成困扰。
  • 当输入信息包含大篇幅英文或者是纯英文时,很多模型和平台会使用英文作答。
  • 由于提示词中没有规定输出的格式,模型的输出结果稳定性欠佳,有时候会有区别。

为解决这些问题,我对提示词进行了以下调整:

  • 要求模型在每次输出前先简要描述每顶帽子的作用。
  • 明确要求模型使用中文回答问题,避免相同的提示词使用不同的平台效果不一致。
  • 可以在提示词中明确输出格式或者选择一个满意的示例作为参考,提升模型输出的稳定性。

调整后的提示词(V2.0)

## 技能
请根据“六顶思考帽”相关知识,分别用 6 顶思考帽对问题进行分析和提供建议,给出每个方面的答案时,先简要介绍一下每顶帽子的作用。

## 示例
用户输入:康威定律
模型回答:
“”“
康威定律(Conway's Law)是由计算机科学家梅尔文·康威(Melvin Conway)在1967年提出的一个定律。康威定律的核心思想是:

“设计系统的架构将反映产生该设计的组织的沟通结构。”

换句话说,软件或系统的设计通常会反映出开发该系统的组织内部的沟通路径和结构。比如,如果一个公司分成了三个团队,分别负责前端、后端和数据库,那么他们所设计的系统可能会自然地分为三个相对独立的部分,彼此之间通过明确的接口进行通信。

康威定律的含义非常深远,它表明了组织结构和系统设计之间的紧密联系。为了更好地理解和应用康威定律,我们可以使用六顶思考帽来分析。

白色帽子(信息帽)
作用:<该帽子的作用>
分析:<对应的分析>
红色帽子(情感帽)
作用:<该帽子的作用>
分析:<对应的分析>
黑色帽子(批判帽)
作用:<该帽子的作用>
分析:<对应的分析>
黄色帽子(乐观帽)
作用:<该帽子的作用>
分析:<对应的分析>
绿色帽子(创造帽)
作用:<该帽子的作用>
分析:<对应的分析>
蓝色帽子(管理帽)
作用:<该帽子的作用>
分析:<对应的分析>

总结来说,康威定律揭示了组织结构和系统设计之间的深层次关系,通过多角度的分析,组织可以在理解和应用这一定律时做出更明智的决策,从而设计出更符合需求的系统。
”“”

## 要求
- 务必使用中文回答

在此版本中,我们要求模型在每个帽子的思考前进行简要说明,明确要求模型使用中文回答问题。

image.png

通过提示词优化,模型的输出更稳定,结果更加符合预期,质量显著提升。


大家不仅可以利用「一键生成」功能自动编写和优化提示词,还可以在「高级设置」中对智能体简介、开场白、灵感和知识进行更全面的配置。


测试满意后,可以通过右上角的分享生成链接,分享给更多人使用。


需要注意的是,对于非常个性化和复杂的场景,提示词很难一次编写就能完全满足需求,需要反复优化。在使用自己创建的智能体时,遇到 Bad Case 并不断调整是常见现象。关键在于掌握常见的提示词编写与调优技巧,遇到问题时能够有清晰的调优思路并快速解决。


更多提示词技巧,参见:一文掌握大模型提示词技巧:从战略到战术


大家可以根据自己的需求,发挥无限地创意,创建适合自己的各种智能体,以提高生活、学习和工作的效率。


五、总结

本文通过“六顶思考帽”这一实例,简要展示了智能体从构想到落地的全过程,希望大家能够在实践中举一反三。正如古语所言,“纸上得来终觉浅,绝知此事要躬行”。要真正掌握提示词工程并创建出能够有效解决问题的智能体,必须在生活、学习和工作中不断实践,积累经验。


然而,在依赖 AI 的同时,我们也需警惕“用进废退”的风险,建议采用“先思考后验证”的方法,先自己思考然后再使用 AI ,避免因过度依赖导致自身思考能力的退化。此外,对于 AI 生成的内容,我们必须保持足够的辨别力,以防止 AI 的幻觉和偏见对我们产生负面影响。只有在平衡使用 AI 与保持独立思考之间找到最佳路径,我们才能在这场技术变革中立于不败之地。


虽然目前的大语言模型并没有想象地那么强大,但“星星之火,可以燎原”。在 AI 时代的早期,掌握提示词工程并善用各种 AI 工具,是抢占时代红利的关键。正如网上盛传的一句话所言,“取代你的不是 AI,而是比你更善用 AI 的人”。通过积极探索各类应用场景,并灵活运用 AI 技术,我们能够更早地享受到 AI 早期的时代红利。


六、彩蛋

在以往的写作过程中,为文章起一个合适的标题往往需要耗费大量精力,而找到合适的配图同样耗时耗力。此外,文章内容也常常因错别字或表达过于口语化而显得不够严谨。为此,我专门创建了一系列智能助手,如“爆款标题助手”、“文章润色助手”、“文章点评助手”、“文章配图助手”和“文章转脑图助手”,以优化写作流程。

image.png

本文的标题是从“爆款标题助手”生成的 10 个候选标题中精挑细选而得;配图由“文章配图助手”、“文章转脑图助手”创作;而文章内容则经过“文章润色助手”的优化,才呈现出现在的最终版本。有时,我还会使用“文章点评助手”从几个关键角度进行打分并给出修改建议,不断优化自己的文章。





来源  |  阿里云开发者公众号

作者  |  悟鸣



相关文章
|
4月前
|
人工智能 自然语言处理 前端开发
AI Agent系列|深入解析Function Calling、MCP和Skills的本质差异与最佳实践
本系列文章基于 Lynxe 作者沈询的实战经验,深入浅出解析 ReAct Agent 的核心原理与工程价值,帮助开发者快速掌握从“写流程”到“造智能体”的关键跃迁。
|
10月前
|
存储 测试技术 开发者
NVFP4量化技术深度解析:4位精度下实现2.3倍推理加速
本文深入解析NVIDIA推出的NVFP4量化技术,探讨其在Blackwell GPU架构下的性能优势。通过对比主流4位量化方法,分析NVFP4在精度、内存和推理吞吐量方面的表现,结合LLM-Compressor与vLLM框架展示量化与部署实践,验证其在消费级与企业级应用中的高效性与实用性。
2518 15
NVFP4量化技术深度解析:4位精度下实现2.3倍推理加速
|
测试技术 API 人机交互
如何让 Agent 规划调用工具
本文主要从规划的重要性、工具设计的作用、优化实践、适用场景几个方面讲述在构建多工具智能体(Agent)系统时,通过引入结构化的“思考与规划”工具和合理的提示工程,能够显著提升模型解决问题的效率和效果。
1722 26
如何让 Agent 规划调用工具
|
5月前
|
存储 人工智能 IDE
AI Coding 长文分享:如何真正把工具用起来,从原理到实践
本文从原理到实践系统地分享了如何高效使用AI编程工具。涵盖其底层机制(如Token计算、工具调用、Codebase索引与Merkle Tree)、提升对话质量的方法(如规则设置、渐进式开发)、实际应用场景(如代码检索、绘图生成、问题排查),并推荐了结合AI的编码最佳实践,包括文档、注释、命名规范和安全合规,旨在帮助不同经验水平的开发者真正把AI工具用好。
AI Coding 长文分享:如何真正把工具用起来,从原理到实践
|
存储 机器学习/深度学习 数据可视化
结合多模态RAG和异步调用实现大模型内容
文章探讨了如何利用多模态大模型和工程优化手段提升物流理赔业务效率。核心方案包括:通过多模态RAG技术实现图片查重,结合异步调用方法优化货损识别功能。
683 36
结合多模态RAG和异步调用实现大模型内容
|
监控 Java 中间件
8G的容器Java堆才4G怎么就OOM了?
本文记录最近一例Java应用OOM问题的排查过程,希望可以给遇到类似问题的同学提供参考。
|
人工智能 数据可视化 算法
重生之我在 Claude 上 “复刻”了 DeepSeek-R1 效果
本文讲述 DeepSeek-R1 出来以后,作者尝试使用提示词工程在 Claude 上“复刻”DeepSeek-R1 使用效果的过程,包括背景介绍、复刻的尝试与优化,还阐述了复刻的意义、对提示词工程的影响。
重生之我在 Claude 上 “复刻”了 DeepSeek-R1 效果
|
12月前
|
机器学习/深度学习 人工智能 算法
如何像 Manus 交付业务需求-- OneAgent + MCPs 范式
本文探讨了从单一LLM调用到复杂Agent系统的发展历程,重点介绍了OneAgent + MCPs范式。该范式通过结合强大的基础Agent和领域特定的MCP(Microservice Capability Provider)来解决复杂业务需求。文章分析了其在保险科技领域的实践,展示了如何通过Loop框架执行任务,并讨论了当前面临的挑战如to-do质量依赖、状态管理和知识整合深度等问题。同时,提出了包括标准化交互生态、提升系统鲁棒性、优化MCP调用管理及应用强化学习等发展方向。最终展望了这一范式在更多行业落地的潜力,强调了快速搭建领域Agent的重要性,而非追求全知全能的GodAgent模式。
如何像 Manus 交付业务需求-- OneAgent + MCPs 范式
|
机器学习/深度学习 小程序 数据挖掘
Multi-Agent 的灵活编排之路
本文探讨了Copilot 3.0架构中规划模块结合DeepSeek R1强化学习(GRPO)的实践,重点分析多智能体架构下大模型如何灵活调度多个智能体解决实际问题。文章从背景、问题分析、Planning角色、难点、效果对比到解决方案进行了深入讲解,并通过实验现象展示了有无思考过程对模型性能的影响。结果显示,GRPO训练后推理长度显著降低,准确率提升7.4个百分点,同时解决了复杂问题与简单问题处理间的平衡问题。
1302 11
Multi-Agent 的灵活编排之路