多模态大一统、AI智能体将如何引领未来?阿里妈妈与人大高瓴学者探讨大模型趋势

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介: 多模态大一统、AI智能体将如何引领未来?阿里妈妈与人大高瓴学者探讨大模型趋势

今年科技领域什么最热?无疑是以大模型和 AIGC 为代表的新一波人工智能技术浪潮。

在这波浪潮中,大家有一个明显的感受:在下游任务中能 work 的技术概念令人目不暇接,而且在很短的时间内就会被广泛采用。以文生图为例,问世还不到一年的 Stable Diffusion 让扩散模型席卷这一领域,Midjourney 更是将其商业价值彻底引爆。类似的概念不止模型,还有一些方法、技巧,比如思维链、RLHF……

与此同时,一些新的技术趋势也在悄悄酝酿,包括多模态、多任务的大一统以及 AI 智能体的崛起。前者的代表性模型包括 Meta 用图像对齐所有模态的 ImageBind、用一个模型分割所有图像的 Segment Anything Model(SAM)等;后者则包括能自动分解任务的 AutoGPT,以及斯坦福、谷歌等打造的多个智能体组成的「虚拟小镇」等。前段时间,特斯拉前 AI 总监、今年年初回归 OpenAI 的 Andrej Karpathy 在一次开发者活动上透露,OpenAI 也对 AI 智能体的发展产生了极大兴趣并寄予了厚望,每当有新的 AI 智能体论文出现时,OpenAI 内部就会非常感兴趣,并认真地进行讨论。

对于普通研究者、从业者来说,能够跟紧这些技术概念、趋势的应用和演变是推进手头工作的重要前提,也是一种寻找新灵感的方式。为此,7 月 25 日下午 14:00,阿里妈妈博见社将联合中国人民大学高瓴人工智能学院举办一场阿里妈妈 & 闲鱼技术节重磅活动,邀请包括窦志成、赵鑫、卢志武、徐君、祁琦、林衍凯、陈旭、李崇轩、黄文炳等在内的人大高瓴人工智能学院众多学者们,一起聊聊关于大模型的那些事。看看当下有哪些值得我们特别关注的技术点,大模型未来将如何发展,又将如何影响数智商业技术。

活动日程


嘉宾介绍

窦志成:中国人民大学高瓴人工智能学院副院长、教授、博士生导师,北京智源人工智能研究院 “智能信息检索与挖掘” 方向项目经理,中国计算机学会大数据专家委员会副秘书长,中国中文信息学会信息检索专委会副主任。2008 至 2014 年在微软亚洲研究院工作,2014 年开始在中国人民大学任教。主要研究方向为智能信息检索、自然语言处理、大数据分析。已在国际知名学术会议和期刊上(如 SIGIR、WWW、CIKM、WSDM、ACL、EMNLP、TKDE 等)发表论文 100 余篇,主持国家自然科学基金项目 3 项,科技部重点研发课题 2 项,企业合作课题 10 余项。获教育部自然科学奖一等奖,SIGIR 2013 最佳论文提名奖,AIRS 2012 最佳论文奖,CCIR 2021 最佳论文奖等奖项。曾担任信息检索领域顶级会议 SIGIR 的程序委员会主席(2019 短文),亚洲信息检索学术会议 AIRS 大会主席 (2016)、全国信息检索学术会议 CCIR 程序委员会主席 (2020)、大会主席(2023)等。任多个国际学术会议的(资深)程序委员会委员。

郑波:阿里妈妈及闲鱼 CTO,阿里妈妈首席科学家,CCF 计算经济学专业组执行委员,负责阿里妈妈广告技术事业部以及闲鱼的包括算法、机器学习、工程架构在内的整体技术工作。毕业于清华大学计算机系,2017 年加入阿里巴巴之前,在谷歌工作了 11 年,领导谷歌的展示广告算法团队以及中国地图团队。研究兴趣:主要研究方向为深度学习、展示和搜索广告算法、多模态以及引擎优化等领域。

赵鑫:现为中国人民大学高瓴人工智能学院教授。2014 年 7 月于北京大学获得博士学位,随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理,尤其是基于大语言模型的基础技术与应用研究,共计发表论文 100 余篇,谷歌学术引用 1 万余次,曾主导研发了伯乐(推荐系统库 RecBole)、妙笔(文本生成库 TextBox)等开源工具。荣获 2020 年吴文俊人工智能优秀青年奖、ECIR 2021 时间检验奖(Test of Time Award)、RecSys 2022 最佳学生论文提名(Best student paper runner-up)、CIKM 2022 最佳资源论文提名(Best resource paper runnerup)等,入选中国科协青年人才托举工程、北京智源青年科学家、CCF-IEEE CS 青年科学家。

卢志武:卢志武博士,中国人民大学高瓴人工智能学院教授,博士生导师。2005 年毕业于北京大学数学科学学院信息科学系,获理学硕士学位;2011 年毕业于香港城市大学计算机系,获 PhD 学位。主要研究方向包括机器学习、计算机视觉等。设计首个公开的中文通用图文预训练模型文澜 BriVL。以主要作者身份发表学术论文 90 余篇,其中在 Nat Commun、TPAMI、IJCV 等国际期刊和 ICML、ICLR、NeurIPS、CVPR、ICCV 等国际会议上发表论文 50 余篇。指导的学生获得 2021 年 CCF 优博、2021 年百度奖学金。担任 CCF 生物信息学专委会委员。担任 NeurIPS、ICML、ICLR、ICCV、CVPR、AAAI、IJCAI 等国际顶级会议的(资深)程序委员。

林衍凯:于 2014 年和 2019 年获得清华大学学士和博士学位。博士毕业后曾在腾讯微信担任高级研究员,于 2022 年加入中国人民大学,任助理教授。其主要研究方向为预训练模型、自然语言处理。曾在 ACL、EMNLP、NAACL、AAAI、IJCAI、NeurIPS 等自然语言处理和人工智能顶级国际会议上发表论文 40 余篇,Google Scholar 统计被引用次数达到 9000 余次,H-index 为 27。其知识指导的自然语言处理研究成果总结为《结构化知识表示学习方法》中的其中三项代表性工作并获评教育部自然科学一等奖,同时成果开源工具包 OpenKE、OpenNRE 在世界影响力最大的开源平台 Github 上获 6400 多个星标,成为国际上知识驱动的自然语言处理的主流工具。曾担任 EMNLP、ACL ARR 等会议的领域主席。

李崇轩:中国人民大学高瓴人工智能学院准聘助理教授,博士生导师。研究方向为概率机器学习。他的代表性工作有:一致性理论下最优的半监督 GAN 方法 Triple-GAN;扩散概率模型在最大似然意义下的最优反向方差估计 Analytic-DPM。李崇轩获机器学习领域重要国际会议 ICLR 2022 年杰出论文奖,2021 年吴文俊人工智能自然科学奖一等奖,2019 年中国计算机学会优秀博士论文和 2017 年微软学者。李崇轩入选 2021 年北京市科技新星,2019 年中国博士后创新人才支持计划,主持国家自然科学基金面上项目。

徐君:中国人民大学高瓴人工智能学院教授(长聘副教授)、中国人民大学杰出学者特聘教授、北京智源人工智能研究院智源学者。曾就职于微软亚洲研究院、华为诺亚方舟实验室(香港)和中国科学院计算技术研究所,于 2018 年 9 月加入中国人民大学工作至今。研究领域包括互联网搜索与推荐模型和系统,发表论文 100 余篇、专著 2 本、授权专利 10 余个,部分研究成果多次被欧美学者收录于信息检索教科书、应用于微软和华为的搜索和推荐产品。获 ACM SIGIR 2019 Test of Time Award Honorable Mention、CIKM 2017 Best Full Paper Runner-up、CCIR 2022、AIRS 2010 和 ICMLC 2005 最佳论文奖,获北京市自然科学奖二等奖(排名第 2)。主持国家重点研发和国家自然科学基金面上项目。

祁琦:中国人民大学高瓴人工智能学院长聘副教授,博导,国家海外高层次青年人才,CCF 中国计算机学会计算经济学专业组秘书长。博士毕业于美国斯坦福大学,导师叶荫宇教授。曾任香港科技大学助理教授、博导。主要研究方向为算法博弈论、机制设计、优化和多智能体系统。曾在国际一流计算机、人工智能、管理学期刊和会议上发表一作 / 通讯论文 40 余篇,包括 OR、MOR、GEB、TR-B 等著名期刊和 STOC、WINE、CCC、IJCAI、NeurIPS 等计算机顶级会议。主持国家高层次人才计划及多项香港科学基金研究项目。任多个国际人工智能、互联网和博弈领域会议的资深程序委员及会议联合主席。同时长期担任 10 多个国际一流期刊评审。科研成果也具备很强的应用价值,在互联网广告上的研究和应用成果获得了两项美国专利。

陈旭:博士毕业于清华大学,于 2020 年加入中国人民大学,任准聘助理教授。研究方向为推荐系统,强化学习,因果推断等。曾在 TheWebConf、AIJ、TKDE、SIGIR、WSDM、TOIS 等著名国际会议 / 期刊发表论文 60 余篇,Google Scholar 引用 4000 余次。他的研究在一定意义上推动了可解释用户行为分析的发展,研究成果曾获得 CCF A 类会议 TheWebConf 2018 优秀论文提名奖、CCF B 类会议 CIKM 2022 最佳资源论文 Runner Up 奖、亚洲著名信息检索会议 AIRS 2017 最佳论文奖等。同时,他也曾获 CCF 自然科学二等奖(排名第二),ACM - 北京新星奖(北京市三人),北京市优秀毕业生等。研究成果在多家企业落地,相关成果荣获华为 “创新先锋” 总裁奖。他主持 / 参与多项国家自然科学基金以及企业合作项目。

黄文炳:中国人民大学高瓴人工智能学院助理教授、博导。曾在清华大学智能产业研究院担任助理研究员,腾讯 AI Lab 担任高级研究员。研究方向包括几何机器学习理论方法,及其在智能药物发现、物理场景理解与模拟、智能体感知与决策等跨领域任务上的应用。代表性工作包括:训练深度图神经网络的方法 DropEdge;面向大规模图的图神经网络高效训练方法 AS-GCN;针对抗体生成的多通道等变注意力网络 MEAN。在人工智能领域顶级会议或期刊(NeurIPS、ICLR、TPAMI 等)发表论文 40 余篇,谷歌学术引用 6000 多次,单篇引用最高 900 多次。申请发明专利 10 余项,授权 5 项。曾获 ICLR 2023 杰出论文提名奖,腾讯犀牛鸟专项研究卓越奖、NeurIPS 2022 Open Catalyst 比赛冠军、IROS 2020 OCRTOC 机器人挑战赛季军、NeurIPS Outstanding Reviewer 等奖项。

相关文章
|
1天前
|
存储 人工智能 Kubernetes
ACK Gateway with AI Extension:面向Kubernetes大模型推理的智能路由实践
本文介绍了如何利用阿里云容器服务ACK推出的ACK Gateway with AI Extension组件,在Kubernetes环境中为大语言模型(LLM)推理服务提供智能路由和负载均衡能力。文章以部署和优化QwQ-32B模型为例,详细展示了从环境准备到性能测试的完整实践过程。
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
AI 世界生存手册(二):从LR到DeepSeek,模型慢慢变大了,也变强了
大家都可以通过写 prompt 来和大模型对话,那大模型之前的算法是怎样的,算法世界经过了哪些比较关键的发展,最后为什么是大模型这条路线走向了 AGI,作者用两篇文章共5.7万字详细探索一下。 第一篇文章指路👉《AI 世界生存手册(一):从LR到DeepSeek,模型慢慢变大了,也变强了》
AI 世界生存手册(二):从LR到DeepSeek,模型慢慢变大了,也变强了
|
5天前
|
人工智能 自然语言处理 安全
Anus:公开整活!完全用 Manus 复刻 Manus 功能的开源 AI 智能体项目
Anus 是一个开源 AI 智能体项目,复刻了 Manus 的部分功能,支持自然语言指令执行、多代理协作、多模态输入处理等功能,旨在为开发者提供强大且灵活的工具。
120 1
Anus:公开整活!完全用 Manus 复刻 Manus 功能的开源 AI 智能体项目
|
8天前
|
人工智能 自然语言处理 前端开发
Spring AI与DeepSeek实战二:打造企业级智能体
本文介绍如何基于Spring AI与DeepSeek模型构建企业级多语言翻译智能体。通过明确的Prompt设计,该智能体能自主执行复杂任务,如精准翻译32种ISO标准语言,并严格遵循输入格式和行为限制。代码示例展示了如何通过API实现动态Prompt生成和翻译功能,确保服务的安全性和可控性。项目已开源,提供更多细节和完整代码。 [GitHub](https://github.com/zlt2000/zlt-spring-ai-app) | [Gitee](https://gitee.com/zlt2000/zlt-spring-ai-app)
104 11
|
11天前
|
人工智能 机器人 物联网
SpatialVLA:上海AI Lab联合上科大推出的空间具身通用操作模型
SpatialVLA 是由上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型,基于百万真实数据预训练,赋予机器人强大的3D空间理解能力,支持跨平台泛化控制。
53 7
SpatialVLA:上海AI Lab联合上科大推出的空间具身通用操作模型
|
11天前
|
人工智能 数据库 决策智能
Archon – 开源 AI 智能体框架,自主生成代码构建 AI 智能体
Archon 是一个开源的 AI 智能体框架,能够自主生成代码并优化智能体性能,支持多智能体协作、领域知识集成和文档爬取等功能,适用于企业、教育、智能家居等多个领域。
104 10
Archon – 开源 AI 智能体框架,自主生成代码构建 AI 智能体
|
12天前
|
机器学习/深度学习 自然语言处理 算法
AI 世界生存手册(一):从LR到DeepSeek,模型慢慢变大了,也变强了
大家都可以通过写 prompt 来和大模型对话,那大模型之前的算法是怎样的,算法世界经过了哪些比较关键的发展,最后为什么是大模型这条路线走向了 AGI,作者用两篇文章共5.7万字详细探索一下。
AI 世界生存手册(一):从LR到DeepSeek,模型慢慢变大了,也变强了
|
13天前
|
机器学习/深度学习 人工智能 并行计算
NotaGen:中央音乐学院联合清华推出AI音乐生成模型,古典乐谱一键生成,音乐性接近人类!
NotaGen 是由中央音乐学院、北京航空航天大学、清华大学等机构联合推出的音乐生成模型,基于模仿大型语言模型的训练范式,能够生成高质量的古典乐谱。该模型通过预训练、微调和强化学习相结合的方式,显著提升了符号音乐生成的艺术性和可控性。
228 15
NotaGen:中央音乐学院联合清华推出AI音乐生成模型,古典乐谱一键生成,音乐性接近人类!
|
13天前
|
缓存 人工智能 自然语言处理
微软发明全新LLM语言,AI智能体交互效率翻倍!
微软发布DroidSpeak技术,优化大型语言模型(LLM)间的通信,显著提升AI智能体交互效率。该技术通过嵌入缓存和键值缓存重用,减少预填充延迟,降低高达50%的延迟,同时保持高质量生成。DroidSpeak适用于多种AI任务,提高协作效率,但在资源受限环境和处理模型差异性方面仍面临挑战。
42 3
|
13天前
|
人工智能 自然语言处理 搜索推荐
HiFox AI:一站式 AI 应用平台,多模型快速接入,自由选用
HiFox AI 是一站式AI应用平台,整合了30多个主流AI模型,提供文本生成、对话交流、图片生成等多种应用场景。平台内置1000+预构建AI应用,支持无代码搭建个性化应用和复杂工作流,帮助用户高效处理重复任务,显著提升工作效率。无论是普通用户还是技术专家,都能在HiFox AI上找到适合自己的解决方案,实现“人人都能使用AI”的愿景。

热门文章

最新文章