Llama 8B搜索100次超越GPT-4o！推理+搜索即可提升性能，新Scaling Law诞生？-阿里云开发者社区

Llama 8B搜索100次超越GPT-4o！推理+搜索即可提升性能，新Scaling Law诞生？

2024-09-08 62

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【9月更文挑战第8天】在人工智能领域，理查德·萨顿提出了一项重要观点，即利用通用计算方法最终是最有效的途径，这一理念在诸如计算机象棋、围棋、语音识别及视觉等多个子领域中得到了验证。萨顿强调，计算能力的指数增长使得依赖大量计算的技术更加吸引人，并且从长远来看，计算能力将是唯一重要的因素。尽管他的观点强调了搜索和学习方法的力量，但也有人批评其忽略了领域知识和其他因素的重要性。

在过去的70年里，人工智能（AI）领域的发展历程中，有一个重要的经验教训被反复验证，那就是通用的、能够利用计算的方法，最终会成为最有效的方法。这一观点的主要支持者是加拿大多伦多大学的计算机科学家理查德·萨顿（Rich Sutton），他在2019年的一篇论文中详细阐述了这一观点。

萨顿的观点基于两个关键因素。首先，他指出摩尔定律的普遍化，即单位计算成本的持续指数下降。这意味着，随着时间的推移，研究人员将能够获得更多的计算资源，这使得依赖于大量计算的方法更具吸引力。其次，萨顿认为，在短期内，研究人员可能会寻求利用他们的领域知识来改进系统，但从长远来看，唯一重要的是利用计算的能力。

萨顿的观点在人工智能领域的多个子领域中得到了验证。在计算机象棋领域，1997年击败世界冠军卡斯帕罗夫的系统是基于大规模的深度搜索。然而，当时大多数计算机象棋研究人员追求的方法是利用人类对象棋特殊结构的理解。当一个更简单的、基于搜索的方法证明比那些依赖于人类知识的方法更有效时，这些研究人员感到失望。

类似的情况也发生在计算机围棋领域，只是时间上晚了20年。最初，研究人员投入了大量的努力来避免搜索，而是利用人类知识或游戏的特殊特征。然而，一旦搜索被有效地应用于大规模，所有这些努力都被证明是无关紧要的，甚至是有害的。

在语音识别领域，也出现了类似的发展模式。在20世纪70年代的一场由DARPA赞助的早期竞赛中，参赛者包括许多利用人类知识的特殊方法。然而，基于隐马尔可夫模型（HMMs）的更统计性的方法最终胜出，并导致了自然语言处理领域的重大变革。

在计算机视觉领域，也出现了类似的情况。早期的方法将视觉视为寻找边缘、一般化圆柱体或SIFT特征的过程。然而，现代的深度学习神经网络只使用卷积和某些类型的不变性的概念，并取得了更好的性能。

萨顿的观点强调了通用方法的力量，这些方法能够随着可用计算的增加而继续扩展，即使可用的计算变得非常大。他认为，能够以这种方式无限扩展的两个方法是搜索和学习。

然而，萨顿的观点也受到了一些批评。一些人认为，他过于强调计算的重要性，而忽视了领域知识的价值。他们认为，在某些情况下，利用领域知识可以导致更有效的解决方案，而不仅仅是依赖于计算能力。

此外，一些人还指出，萨顿的观点可能低估了人工智能领域中其他因素的重要性，如数据质量、算法设计和系统架构等。他们认为，虽然计算能力是重要的，但它并不是唯一重要的因素。

原文地址：https://www.cs.utexas.edu/~eunsol/courses/data/bitter_lesson.pdf

Llama 8B搜索100次超越GPT-4o！推理+搜索即可提升性能，新Scaling Law诞生？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Llama 8B搜索100次超越GPT-4o！推理+搜索即可提升性能，新Scaling Law诞生？

热门文章

最新文章

相关课程

相关电子书

相关实验场景