文档备案控制台

开发者社区人工智能文章正文

多模态模型可能是大模型的终局

2023-12-15 240

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 多模态模型可能是大模型的终局

计算机视觉、机器学习领域国际顶级专家颜水成在学术界钻研 8 年、工业界实践 8 年，今年 9 月正式宣布加入昆仑万维，出任天工智能联席 CEO，并兼任昆仑万维 2050 全球研究院院长。

长期以来，业界的目光聚集于他，为什么是昆仑万维？对人工智能领域而言意味着什么？在大模型火热发展的当下，他试图以 Foundation Models（基座大模型）为基准点，探寻通往通用人工智能领域的道路。

自昆仑万维的天工大模型在今年 4 月正式发布并启动邀请测试以来，一直以较快的节奏发布更新，也始终在百模大战中保持着一定的竞争力。11 月，「天工」大模型通过《生成式人工智能服务管理暂行办法》备案，面向全社会开放服务。紧接着，昆仑万维正式开源了「天工 Skywork-13B 系列」。13B，在颜水成看来是最适合商用的尺寸，未来将迸发出多大能量？他一直追求学术界和工业界的 Double Satisfactions，产学研的有机结合能否在 Foundation Models 领域结出硕果？令人期待~

本期《涛滔不绝》，CSDN 创始人&董事长、中国开源软件推进联盟副主席蒋涛与天工智能联席 CEO、兼任昆仑万维 2050 全球研究院院长颜水成，从 AGI 的本质谈到基座大模型的重要性，从基座大模型到“更高一层”的 Agent 智能体，带领我们探寻 AI 发展更高维度的世

协议，转载请附上原文出处链接及本声明。

文章标签：

人工智能

计算机视觉

机器学习/深度学习

游客q3vllmwwzumey

目录

相关文章

霍格沃兹测试开发学社

|

9月前

|

存储人工智能 NoSQL

AI大模型应用实践八：如何通过RAG数据库实现大模型的私有化定制与优化

RAG技术通过融合外部知识库与大模型，实现知识动态更新与私有化定制，解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型（向量库、图库、知识图谱、混合架构）及应用场景，助力企业高效构建安全、可解释的智能系统。

霍格沃兹测试开发学社

1931 2 3

时光在流逝

|

9月前

|

机器学习/深度学习人工智能人机交互

当AI学会“看”和“听”：多模态大模型如何重塑人机交互

当AI学会“看”和“听”：多模态大模型如何重塑人机交互

时光在流逝

701 121 121

九月天空

|

9月前

|

数据采集人工智能搜索推荐

智能新纪元：多模态大模型如何重塑人机交互

智能新纪元：多模态大模型如何重塑人机交互

九月天空

416 113 113

九月天空

|

9月前

|

人工智能人机交互知识图谱

当AI学会“融会贯通”：多模态大模型如何重塑未来

当AI学会“融会贯通”：多模态大模型如何重塑未来

九月天空

489 114 114

代码bug生产队

|

9月前

|

人工智能搜索推荐程序员

当AI学会“跨界思考”：多模态模型如何重塑人工智能

当AI学会“跨界思考”：多模态模型如何重塑人工智能

代码bug生产队

1306 120 120

代码bug生产队

|

9月前

|

人工智能安全搜索推荐

当AI学会“看”和“听”：多模态大模型如何重塑人机交互

当AI学会“看”和“听”：多模态大模型如何重塑人机交互

代码bug生产队

881 117 118

modelscope

|

10月前

|

自然语言处理机器人图形学

腾讯混元图像3.0正式开源发布！80B，首个工业级原生多模态生图模型

腾讯混元图像3.0，真的来了——开源，免费开放使用。正式介绍一下：混元图像3.0（HunyuanImage 3.0），是首个工业级原生多模态生图模型，参数规模80B，也是目前测评效果最好、参数量最大的开源生图模型，效果可对…

modelscope

2011 2 3

腾讯混元图像3.0正式开源发布！80B，首个工业级原生多模态生图模型

八进智

|

9月前

|

缓存物联网 PyTorch

使用TensorRT LLM构建和运行Qwen模型

本文档介绍如何在单GPU和单节点多GPU上使用TensorRT LLM构建和运行Qwen模型，涵盖模型转换、引擎构建、量化推理及LoRA微调等操作，并提供详细的代码示例与支持矩阵。

八进智

2515 2 2

安全风信子

|

9月前

|

存储机器学习/深度学习人工智能

54_模型优化：大模型的压缩与量化

随着大型语言模型(LLM)的快速发展，模型规模呈指数级增长，从最初的数亿参数到如今的数千亿甚至万亿参数。这种规模扩张带来了惊人的能源消耗和训练成本，同时也给部署和推理带来了巨大挑战。2025年，大模型的"瘦身"已成为行业发展的必然趋势。本文将深入剖析大模型压缩与量化的核心技术、最新进展及工程实践，探讨如何通过创新技术让大模型在保持高性能的同时实现轻量化部署，为企业和开发者提供全面的技术指导。

安全风信子

888 0 0

热门文章

最新文章

中文竞技场（MS）大模型评测

科普神文，一次性讲透AI大模型的核心概念

本地部署开源大模型的完整教程：LangChain + Streamlit+ Llama

DeepSeek加持的通义灵码2.0 AI程序员实战案例：助力嵌入式开发中的算法生成革新

通义灵码 Rules 来了：个性化代码生成，对抗模型幻觉

蚂蚁金服“生物特征识别多模态融合”IEEE标准成功立项

月之暗面开源16B轻量级多模态视觉语言模型！Kimi-VL：推理仅需激活2.8B，支持128K上下文与高分辨率输入

Firefly：开源大模型训练工具助力AI技术进步，让你轻松训练各种主流大模型！

基于文档智能&RAG搭建更懂业务的AI大模型

Megrez-3B-Omni: 首个端侧全模态理解开源模型

大模型强化学习的熵控制：CE-GPPO、EPO与AsyPPO技术方案对比详解

当AI开始“思考”：为什么大模型的尽头是推理？

大模型分布式推理：张量并行与流水线并行技术

构建AI智能体：一、初识AI大模型与API调用

【大模型微调】一文掌握5种大模型微调的方法

从“看见”到“预见”：合合信息“多模态文本智能技术”如何引爆AI下一场革命。

AI Agent的未来之争：任务规划，该由人主导还是AI自主？——阿里云RDS AI助手的最佳实践

C3仓库AI代码门禁通用实践：基于Qwen3-Coder+RAG的代码评审

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

AI Agent越用越笨？阿里云AnalyticDB「AI上下文工程」一招破解！

相关课程

更多

阿里云大模型能力培训（永耀）

国家电网大模型ACP培训

大模型 Clouder认证：基于PAI ArtLab的AIGC设计基础

阿里云大模型工程师ACA认证课程

阿里云百炼大模型产品实践

相关电子书

更多

OpenSearch向量检索和大模型方案

通义万相：视觉生成大模型的进化与应用

达摩院通义视觉生成大模型

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！