生成式模型不只会模仿！哈佛、UCSB等最新成果：性能可超越训练集专家水平-阿里云开发者社区

生成式模型不只会模仿！哈佛、UCSB等最新成果：性能可超越训练集专家水平

2024-07-24 31

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【7月更文挑战第23天】研究人员从哈佛大学、UC Santa Barbara等机构展示了生成式模型的新突破：在特定任务上实现超越训练集专家水平的性能。通过“低温度采样”减少模型不确定性，实验中一个名为ChessFormer的模型在下棋任务上表现出了超越性，即性能超过了训练集中专家的平均水平。这项工作揭示了生成式模型在特定条件下实现超越的可能性，为该领域的研究和应用提供了新视角。[论文](https://arxiv.org/pdf/2406.11741)

最近，来自哈佛大学、UC Santa Barbara等机构的研究人员在生成式模型（Generative Models，GMs）领域取得了一项突破性的成果。他们的研究结果表明，生成式模型在特定任务上的性能可以超越训练集专家的水平，这一现象被称为“超越性”（transcendence）。

超越性是指生成式模型在特定任务上的性能超过了训练集中所有专家的平均水平。这可能听起来有些违反直觉，因为通常情况下，模型的性能应该受到训练数据的限制。然而，研究人员通过实验和理论分析，揭示了生成式模型在特定条件下实现超越性的可能性。

研究人员发现，生成式模型可以通过一种称为“低温度采样”（low-temperature sampling）的机制实现超越性。低温度采样是一种在模型输出概率分布上进行操作的方法，它倾向于选择概率较高的输出，从而减少模型的不确定性。研究人员证明，在低温度采样下，生成式模型可以通过减少专家的错误和偏差来实现超越性。

为了验证他们的理论，研究人员在下棋任务上进行了实验。他们训练了一个名为ChessFormer的生成式模型，该模型通过预测下一步棋来学习下棋。研究人员发现，当ChessFormer在低温度采样下运行时，它的下棋水平可以超过训练集中所有专家的平均水平。

研究人员还对超越性进行了理论分析。他们证明了在特定条件下，生成式模型可以通过低温度采样实现超越性。具体来说，他们考虑了两种情况：一种是数据由单个专家生成，另一种是数据由多个专家生成。对于第一种情况，他们证明了生成式模型可以通过低温度采样减少专家的错误来实现超越性。对于第二种情况，他们证明了生成式模型可以通过低温度采样整合多个专家的知识来实现超越性。

这项研究结果表明，生成式模型在特定任务上的性能可以超越训练集专家的水平，这为生成式模型的研究和应用开辟了新的可能。然而，需要注意的是，超越性并不是生成式模型的普遍特性，而是在特定条件下才能实现。此外，超越性也带来了一些伦理和安全问题，例如模型可能会学习到专家的偏见和错误。因此，在将生成式模型应用于实际任务时，需要仔细考虑这些问题并采取相应的措施。

论文链接：https://arxiv.org/pdf/2406.11741

生成式模型不只会模仿！哈佛、UCSB等最新成果：性能可超越训练集专家水平

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

生成式模型不只会模仿！哈佛、UCSB等最新成果：性能可超越训练集专家水平

热门文章

最新文章

相关课程

相关电子书

相关实验场景