大模型能否通往AGI？-阿里云开发者社区

大模型能否通往AGI？

2024-03-20 88

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【2月更文挑战第29天】复旦大学张奇教授探讨大模型与人工通用智能（AGI）关系，指出大模型研发需大量资源，企业成为推动力，强调中国应加强自主创新。新书《大规模语言模型：从理论到实践》探讨合作模式及技术细节。张教授认为大模型处理多模态信息有挑战， Scaling Law存在争议，小模型在特定场景有优势。目前大模型尚未达到AGI的推理能力，实现商业化需平衡成本与收益。他通过项目展示大模型的社会应用潜力。

在人工智能领域，大模型的发展无疑是近年来最受瞩目的焦点之一。复旦大学张奇教授在一次访谈中深入探讨了大模型与人工通用智能（AGI）之间的关系，提出了一系列富有洞见的观点。

张教授首先指出，大模型的研究与开发需要巨额的资金和资源，这对于资源有限的学术界来说是一个巨大的挑战。在这样的背景下，企业成为了推动大模型发展的重要力量。他强调，中国在这一领域的发展必须加快步伐，不能仅仅依赖于引进和应用，而应该加强自主创新。

张教授的新著《大规模语言模型：从理论到实践》为读者提供了一本全面了解大模型的指南。书中不仅详细介绍了大模型的结构和数据处理方法，还探讨了分布式训练和模型微调的技术细节。更重要的是，张教授在书中提出了学术界与企业合作的模式，认为这种合作能够促进双方的共同进步，并在特定场景下挖掘科学问题。

在讨论大模型的研究进展时，张教授认为，尽管国内外的技术差距在缩小，但要准确评估与国际领先水平的距离仍然困难。他提出，大模型的发展方向虽然正确，但仍有许多技术细节和实现方式有待探索。

张教授进一步指出，大模型在处理视频数据等多模态信息时面临诸多挑战。从视频数据的准备到网络架构的选择，再到模型稳定性的保证，每一个环节都需要大量的研究和实验。

在谈到Scaling Law时，张教授表达了学术界对此的争议。他认为，仅仅通过扩大模型规模并不能保证性能的提升。他通过实验数据说明，大模型在某些任务上的性能提升有限，而所谓的“涌现”现象也缺乏足够的证据支持。

张教授还提到了小模型的研究价值，尤其是在资源受限的嵌入式设备中。他认为，小模型在特定任务上可能有更好的表现，并且对于边缘计算具有独特的优势。

在企业应用方面，张教授指出大模型在普遍任务上的表现尚不能满足企业对特定任务的高标准要求。他强调，大模型的产品化是实现商业化的关键，需要在成本和收益之间找到平衡点。

关于AGI的概念，张教授明确表示，目前的大模型还不具备实现AGI所需的推理能力。他认为，演绎推理、归纳推理和溯因推理是实现AGI的关键，而大模型在这些方面还有很长的路要走。

张教授还分享了他领导的大模型应用项目，如复旦的眸思模型和“听见世界”公益项目，展示了大模型在解决特定社会问题上的潜力。

大模型能否通往AGI？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

大模型能否通往AGI？

热门文章

最新文章

相关课程

相关电子书

相关实验场景