生成式模型不只会模仿!哈佛、UCSB等最新成果:性能可超越训练集专家水平

简介: 【7月更文挑战第23天】研究人员从哈佛大学、UC Santa Barbara等机构展示了生成式模型的新突破:在特定任务上实现超越训练集专家水平的性能。通过“低温度采样”减少模型不确定性,实验中一个名为ChessFormer的模型在下棋任务上表现出了超越性,即性能超过了训练集中专家的平均水平。这项工作揭示了生成式模型在特定条件下实现超越的可能性,为该领域的研究和应用提供了新视角。[论文](https://arxiv.org/pdf/2406.11741)

最近,来自哈佛大学、UC Santa Barbara等机构的研究人员在生成式模型(Generative Models,GMs)领域取得了一项突破性的成果。他们的研究结果表明,生成式模型在特定任务上的性能可以超越训练集专家的水平,这一现象被称为“超越性”(transcendence)。

超越性是指生成式模型在特定任务上的性能超过了训练集中所有专家的平均水平。这可能听起来有些违反直觉,因为通常情况下,模型的性能应该受到训练数据的限制。然而,研究人员通过实验和理论分析,揭示了生成式模型在特定条件下实现超越性的可能性。

研究人员发现,生成式模型可以通过一种称为“低温度采样”(low-temperature sampling)的机制实现超越性。低温度采样是一种在模型输出概率分布上进行操作的方法,它倾向于选择概率较高的输出,从而减少模型的不确定性。研究人员证明,在低温度采样下,生成式模型可以通过减少专家的错误和偏差来实现超越性。

为了验证他们的理论,研究人员在下棋任务上进行了实验。他们训练了一个名为ChessFormer的生成式模型,该模型通过预测下一步棋来学习下棋。研究人员发现,当ChessFormer在低温度采样下运行时,它的下棋水平可以超过训练集中所有专家的平均水平。

研究人员还对超越性进行了理论分析。他们证明了在特定条件下,生成式模型可以通过低温度采样实现超越性。具体来说,他们考虑了两种情况:一种是数据由单个专家生成,另一种是数据由多个专家生成。对于第一种情况,他们证明了生成式模型可以通过低温度采样减少专家的错误来实现超越性。对于第二种情况,他们证明了生成式模型可以通过低温度采样整合多个专家的知识来实现超越性。

这项研究结果表明,生成式模型在特定任务上的性能可以超越训练集专家的水平,这为生成式模型的研究和应用开辟了新的可能。然而,需要注意的是,超越性并不是生成式模型的普遍特性,而是在特定条件下才能实现。此外,超越性也带来了一些伦理和安全问题,例如模型可能会学习到专家的偏见和错误。因此,在将生成式模型应用于实际任务时,需要仔细考虑这些问题并采取相应的措施。

论文链接:https://arxiv.org/pdf/2406.11741

目录
相关文章
|
6月前
|
存储 人工智能
GPT-4尚未出现自我意识!这项研究用上帝之点解读,迈向AGI局限无法克服
【6月更文挑战第21天】研究人员构建了智能与意识的“飞行模型”,定义了全知全能代理(Ω点)和绝对零代理(α点),以此评估AI的智能水平。目前AI接近人类智能但缺乏自我意识。该模型为理解AI的智能和意识提供新视角,但也因理论概念的实证支持不足及忽视环境影响的多样性而受到批评。[DOI: 10.13140/RG.2.2.24518.28484]
84 6
|
5月前
|
测试技术
8B尺寸达到GPT-4级性能!北大等提出医疗专家模型训练方法
【7月更文挑战第8天】北京大学等研究者提出的新方法缓解了大模型如Llama-3-8B在持续预训练时的“稳定性差距”,通过多轮次训练、高质量子语料库选择和数据混合策略,提升性能和效率。在医疗领域,他们将OpenLlama-3B性能提升至40.7%,并创建的Llama-3-Physician模型达到GPT-4级别。尽管取得突破,该方法在其他模型和领域的适用性仍需探索,且持续预训练仍资源密集。[链接: https://arxiv.org/abs/2406.14833]
93 25
|
6月前
|
数据采集 机器学习/深度学习 人工智能
可信度超越GPT-4V,清华&面壁揭秘小钢炮模型背后的高效对齐技术
【6月更文挑战第15天】清华大学与面壁智能合作的RLAIF-V框架挑战GPT-4V,通过开源AI反馈增强大语言模型的可信度。该框架利用开放数据和在线学习优化对齐,减少幻觉错误,12B参数模型表现超越GPT-4V。虽有数据质量和稳定性问题,但展示出开源MLLMs潜力。[链接: https://arxiv.org/abs/2405.17220]
129 1
|
机器学习/深度学习 人工智能 安全
调查分析两百余篇大模型论文,数十位研究者一文综述RLHF的挑战与局限
调查分析两百余篇大模型论文,数十位研究者一文综述RLHF的挑战与局限
333 0
|
机器学习/深度学习 编解码 人工智能
斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果(1)
斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果
179 0
|
机器学习/深度学习
斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果(2)
斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果
173 0
|
机器学习/深度学习 人工智能 自然语言处理
与生成模型相比,为何机器人研究还在用几年前的老方法?(1)
与生成模型相比,为何机器人研究还在用几年前的老方法?
120 0
|
机器学习/深度学习 人工智能 自然语言处理
与生成模型相比,为何机器人研究还在用几年前的老方法?
与生成模型相比,为何机器人研究还在用几年前的老方法?
121 0
|
机器学习/深度学习 人工智能 自然语言处理
与生成模型相比,为何机器人研究还在用几年前的老方法?(2)
与生成模型相比,为何机器人研究还在用几年前的老方法?
|
机器学习/深度学习 人工智能 算法
大型语言模型教会智能体进化,OpenAI这项研究揭示了二者的互补关系
大型语言模型教会智能体进化,OpenAI这项研究揭示了二者的互补关系
165 0