【大语言模型-论文速读】GPT的不确定性判断-阿里云开发者社区

【大语言模型-论文速读】GPT的不确定性判断

2024-10-23 49

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【大语言模型-论文速读】GPT的不确定性判断

【大语言模型-论文精读】GPT’s Judgements Under Uncertainty

Authors: Payam Saeedi and Mahsa Goodarzi

论文：https://arxiv.org/pdf/2410.02820

文章标题翻译

GPT的不确定性判断

Payam Saeedi Rochester Institute of Technology

Mahsa Goodarzi The State University of New York at Albany

摘要

本文研究了人类认知中的固有偏见（例如损失厌恶、框架效应和合取谬误）是否体现在GPT-4o在概率场景中的判断和决策中。通过在九种认知偏见上进行1350次实验，并分析统计与启发式推理的回答，我们展示了GPT-4o在回应具有相似底层概率表示的提示时的矛盾方法。研究结果还揭示了AI的表现参差不齐，它既展示了类似人类的启发式错误，也做出了统计上合理的决策，尽管它经历了相同提示的相同迭代。

创新点

认知偏见的AI体现: 研究了人类认知偏见是否以及如何体现在大型语言模型（LLMs）的决策和判断中。
大规模实验: 在九种不同的认知偏见上进行了1350次实验，以评估GPT-4o的反应。
统计与启发式推理的对比: 分析了GPT-4o的回答是属于统计推理还是启发式推理。

算法模型

GPT-4o: 使用OpenAI的API进行实验，GPT-4o是目前为止OpenAI提供的速度最快、效率最高的模型。
零次推理链: 在实验中使用了零次推理链提示技术，让AI以“参与社会实验的人类”的角色进行回答。

实验效果

实验总数: 1350次
详细数据:

合取谬误: GPT-4o在所有实验中几乎总是提供了统计上合理且正确的回答。
概率忽视: 在某些概率忽视实验中，GPT-4o能够正确理解并应用概率概念。
框架效应: GPT-4o在正负框架的同一场景中给出了矛盾的回答。
损失厌恶和展望理论: GPT-4o在大多数实验中未能考虑基于硬币翻转结果的预期价值。

结论: GPT-4o在处理某些类型的认知偏见时表现出了较高的性能，但在特定条件下仍然容易受到认知偏见的影响。

文章中提到的GPT-4o模型在处理认知偏见方面的表现呈现出一种混合的模式，它在某些领域做得较好，而在其他领域则存在明显的不足。具体而言，如下

做得好的方面：

合取谬误（Conjunction Fallacy）：

GPT-4o在处理合取谬误方面表现出色，始终提供了统计上合理且正确的回答。它能够理解并且正确地应用概率原则，即两个集合的交集总是小于任一集合的大小。

某些概率忽视（Probability Neglect）：

在某些概率忽视的实验中，GPT-4o能够正确地识别事件的独立性，并据此做出反应。例如，当询问一系列硬币投掷中出现正面的概率时，GPT-4o能够坚持每次投掷的概率是独立的。

有待改进的方面：

偏见相似性（Bias of Resemblence）：

GPT-4o在识别和处理偏见相似性方面表现不佳，几乎在所有情况下都依赖于简化的启发式方法，而不是基于基础概率进行判断。

框架效应（Framing Effect）：

在框架效应的实验中，GPT-4o对于同一场景的不同表述给出了矛盾的回答，表现出了与人类类似的启发式错误。

损失厌恶（Loss Aversion）和展望理论（Prospect Theory）：

GPT-4o在处理损失厌恶和展望理论相关的实验时，往往忽略了基于硬币投掷结果的预期价值，倾向于选择风险较小的选项，而不是根据概率计算预期价值。

沉没成本谬误（Sunk Cost Fallacy）：

尽管GPT-4o能够识别沉没成本谬误并正确引用这一概念，但在实验中它在82%的情况下正确回答，仍有18%的情况未能正确处理。

后记

如果您对我的博客内容感兴趣，欢迎三连击(点赞，关注和评论)，我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型，深度学习，计算机视觉相关方向)最新学术论文及工程实践方面的内容分享，助力您更快更准更系统地了解 AI前沿技术。

【大语言模型-论文速读】GPT的不确定性判断