多模态模型可能是大模型的终局

简介: 多模态模型可能是大模型的终局

计算机视觉、机器学习领域国际顶级专家颜水成在学术界钻研 8 年、工业界实践 8 年,今年 9 月正式宣布加入昆仑万维,出任天工智能联席 CEO,并兼任昆仑万维 2050 全球研究院院长。


长期以来,业界的目光聚集于他,为什么是昆仑万维?对人工智能领域而言意味着什么?在大模型火热发展的当下,他试图以 Foundation Models(基座大模型)为基准点,探寻通往通用人工智能领域的道路。


自昆仑万维的天工大模型在今年 4 月正式发布并启动邀请测试以来,一直以较快的节奏发布更新,也始终在百模大战中保持着一定的竞争力。11 月,「天工」大模型通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务。紧接着,昆仑万维正式开源了「天工 Skywork-13B 系列」。13B,在颜水成看来是最适合商用的尺寸,未来将迸发出多大能量?他一直追求学术界和工业界的 Double Satisfactions,产学研的有机结合能否在 Foundation Models 领域结出硕果?令人期待~


本期《涛滔不绝》,CSDN 创始人&董事长、中国开源软件推进联盟副主席蒋涛与天工智能联席 CEO、兼任昆仑万维 2050 全球研究院院长颜水成,从 AGI 的本质谈到基座大模型的重要性,从基座大模型到“更高一层”的 Agent 智能体,带领我们探寻 AI 发展更高维度的世

协议,转载请附上原文出处链接及本声明。


相关文章
|
2天前
|
机器学习/深度学习 人工智能 调度
高效评估多模态预训练对齐质量,中科大提出模态融合率MIR
中国科学技术大学研究团队提出了一种新的评估指标——模态融合率(MIR),用于评估多模态预训练模型的对齐质量。MIR通过衡量不同模态之间的分布距离,有效反映了模型的对齐质量,并在多种训练配置下表现出良好的鲁棒性和通用性。实验结果表明,MIR能够准确评估训练数据选择、训练策略调度和模型架构设计对预训练结果的影响,为多模态学习提供了可靠的方法。
31 22
|
3月前
|
编解码 定位技术 计算机视觉
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
【9月更文挑战第2天】浙江大学领衔的研究团队针对多模态大型模型(MLLM)在抽象图像理解和视觉推理上的不足,提出了一种利用GPT-4合成数据构建多模态基准的方法。该研究通过合成数据提高了MLLM处理图表、文档等复杂图像的能力,并构建了一个包含11,193条指令的基准,涵盖8种视觉场景。实验表明,这种方法能显著提升模型性能,但依赖闭源模型和高计算成本是其局限。论文详细内容见:https://arxiv.org/pdf/2407.07053
90 10
|
5月前
|
存储 人工智能 自然语言处理
VLMs多模态大模型当下进展与思考(2)
VLMs多模态大模型当下进展与思考
299 10
|
5月前
|
存储 编解码 人工智能
VLMs多模态大模型当下进展与思考(1)
VLMs多模态大模型当下进展与思考
280 9
|
6月前
|
Python
技术心得:判别式模型vs.生成式模型
技术心得:判别式模型vs.生成式模型
31 0
|
7月前
|
机器学习/深度学习 自然语言处理 算法
一文综述,未来已来 | 视觉和大语言模型的未来是什么?必然结连理实现多模态大模型
一文综述,未来已来 | 视觉和大语言模型的未来是什么?必然结连理实现多模态大模型
189 1
|
机器学习/深度学习 人工智能 自然语言处理
中山大学HCP实验室新突破:用因果范式再升级多模态大模型
中山大学HCP实验室新突破:用因果范式再升级多模态大模型
155 0
|
人工智能 编解码 自然语言处理
一句话生成3D模型:AI扩散模型的突破,让建模师慌了
一句话生成3D模型:AI扩散模型的突破,让建模师慌了
841 0
|
机器学习/深度学习 自然语言处理 算法
星际争霸II协作对抗基准超越SOTA,新型Transformer架构解决多智能体强化学习问题
星际争霸II协作对抗基准超越SOTA,新型Transformer架构解决多智能体强化学习问题
191 0
|
机器学习/深度学习 人工智能 自然语言处理
LeCun预言的自监督模型来了:首个多模态高性能自监督算法,语音、图像文本全部SOTA
LeCun预言的自监督模型来了:首个多模态高性能自监督算法,语音、图像文本全部SOTA
250 0
下一篇
DataWorks