大模型能否通往AGI?

简介: 【2月更文挑战第29天】复旦大学张奇教授探讨大模型与人工通用智能(AGI)关系,指出大模型研发需大量资源,企业成为推动力,强调中国应加强自主创新。新书《大规模语言模型:从理论到实践》探讨合作模式及技术细节。张教授认为大模型处理多模态信息有挑战, Scaling Law存在争议,小模型在特定场景有优势。目前大模型尚未达到AGI的推理能力,实现商业化需平衡成本与收益。他通过项目展示大模型的社会应用潜力。

b4aad3c3eadeb7d3576c083156cdec79.jpg
在人工智能领域,大模型的发展无疑是近年来最受瞩目的焦点之一。复旦大学张奇教授在一次访谈中深入探讨了大模型与人工通用智能(AGI)之间的关系,提出了一系列富有洞见的观点。

张教授首先指出,大模型的研究与开发需要巨额的资金和资源,这对于资源有限的学术界来说是一个巨大的挑战。在这样的背景下,企业成为了推动大模型发展的重要力量。他强调,中国在这一领域的发展必须加快步伐,不能仅仅依赖于引进和应用,而应该加强自主创新。

张教授的新著《大规模语言模型:从理论到实践》为读者提供了一本全面了解大模型的指南。书中不仅详细介绍了大模型的结构和数据处理方法,还探讨了分布式训练和模型微调的技术细节。更重要的是,张教授在书中提出了学术界与企业合作的模式,认为这种合作能够促进双方的共同进步,并在特定场景下挖掘科学问题。

在讨论大模型的研究进展时,张教授认为,尽管国内外的技术差距在缩小,但要准确评估与国际领先水平的距离仍然困难。他提出,大模型的发展方向虽然正确,但仍有许多技术细节和实现方式有待探索。

张教授进一步指出,大模型在处理视频数据等多模态信息时面临诸多挑战。从视频数据的准备到网络架构的选择,再到模型稳定性的保证,每一个环节都需要大量的研究和实验。

在谈到Scaling Law时,张教授表达了学术界对此的争议。他认为,仅仅通过扩大模型规模并不能保证性能的提升。他通过实验数据说明,大模型在某些任务上的性能提升有限,而所谓的“涌现”现象也缺乏足够的证据支持。

张教授还提到了小模型的研究价值,尤其是在资源受限的嵌入式设备中。他认为,小模型在特定任务上可能有更好的表现,并且对于边缘计算具有独特的优势。

在企业应用方面,张教授指出大模型在普遍任务上的表现尚不能满足企业对特定任务的高标准要求。他强调,大模型的产品化是实现商业化的关键,需要在成本和收益之间找到平衡点。

关于AGI的概念,张教授明确表示,目前的大模型还不具备实现AGI所需的推理能力。他认为,演绎推理、归纳推理和溯因推理是实现AGI的关键,而大模型在这些方面还有很长的路要走。

张教授还分享了他领导的大模型应用项目,如复旦的眸思模型和“听见世界”公益项目,展示了大模型在解决特定社会问题上的潜力。

目录
相关文章
|
11月前
|
人工智能 自动驾驶 安全
什么是AGI
通用人工智能(AGI)指具备或超越人类智能的机器系统,能跨领域学习、推理和解决问题。其核心特点包括跨领域能力、自主学习与推理、类人思维模式及自适应性。目前AGI仍处早期阶段,但大模型和多模态技术正推动其从理论走向应用,如自动驾驶、科学研究和工业自动化等。尽管前景广阔,AGI仍面临技术瓶颈、伦理安全和资源需求等挑战。未来,AGI有望重塑产业和社会生活方式。
7528 2
|
机器学习/深度学习 数据采集 人工智能
AI大模型知识点大梳理1
AI大模型是什么 AI大模型发展历程
1216 0
|
机器学习/深度学习 人工智能 自然语言处理
【自然语言处理】自然语言处理NLP概述及应用
自然语言处理(Natural Language Processing,简称NLP)是一门集计算机科学、人工智能以及语言学于一体的交叉学科,致力于让计算机能够理解、解析、生成和处理人类的自然语言。它是人工智能领域的一个关键分支,旨在缩小人与机器之间的交流障碍,使得机器能够更有效地识别并响应人类的自然语言指令或内容。
897 4
|
机器学习/深度学习 人工智能 算法
谈谈创意设计中的AI、AGI、AIGC
创意设计领域在AI、AGI和AIGC的影响下正经历深刻变革。AI通过机器学习辅助设计,从市场分析到后期优化,提高设计师效率。AGI潜在地模仿人类创造力,可能开启全新设计时代。AIGC生成内容速度快,但也面临创意局限性和法律问题。Adobe国际认证提供权威技能验证,帮助设计师适应新技术,提升行业标准和国际交流。
|
自然语言处理 监控 物联网
自然语言处理(NLP)微调
自然语言处理(NLP)微调
329 0
|
人工智能 安全 图形学
【AI落地应用实战】篡改检测技术前沿探索——从基于检测分割到大模型
在数字化洪流席卷全球的当下,视觉内容已成为信息交流与传播的核心媒介,然而,随着PS技术和AIGC技术的飞速发展,图像篡改给视觉内容安全带来了前所未有的挑战。 本文将探讨篡改检测技术的现实挑战,分享篡改检测技术前沿和最新应用成果。
|
安全 物联网 网络安全
|
存储
十六进制是什么
【8月更文挑战第9天】 十六进制是什么
3372 1
|
机器学习/深度学习 人工智能 算法
这篇科普让你Get所有大模型的基础核心知识点
本文介绍了AI大模型的概念和发展历程。AI大模型是指具有1亿以上参数的机器学习模型,通过在大规模数据集上进行预训练,可以直接支撑各类应用。大模型的发展经历了从萌芽期到AI1.0时期,再到AI2.0时期的飞跃,目前最新发布的大模型参数已经达到了千亿甚至万亿级别。国内外的公司都在积极研发和应用大模型,如OpenAI、Google、Facebook、Microsoft等。国内也有百度、阿里巴巴、万维、商汤科技等公司发布了自己的大模型产品。大模型的建造离不开算力资源、算法人才、数据积累等核心要素。此外,文章还列举了一些与大模型相关的专业名词,如算法、模型参数、训练数据、Token等。