7 Papers & Radios | 李德毅院士认知物理学前瞻性观点论文;AI从零开始学会玩我的世界

简介: 7 Papers & Radios | 李德毅院士认知物理学前瞻性观点论文;AI从零开始学会玩我的世界

本周论文包括李德毅院士前瞻性观点论文:《认知物理学 —— 薛定谔、图灵和维纳的启示和超越》;AI 从零开始学会玩《我的世界》,DeepMind AI 通用化取得突破。


目录:

1. STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing2. Cell-type-specific prediction of 3D chromatin organization enables high-throughput in silico genetic screening3. Cognitive Physics - The Enlightenment by Schrödinger, Turing, Wiener and Beyond4. Performance of ChatGPT on USMLE: Potential for AI-Assisted Medical Education Using Large Language Models5. Mastering Diverse Domains through World Models6. ParkPredict+: Multimodal Intent and Motion Prediction for Vehicles in Parking Lots with CNN and Transformer7. ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders8. ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)

论文 1:STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing


摘要:近期,阿里巴巴达摩院联合中国科学院深圳先进技术研究院提出面向多轮 Text-to-SQL 语义解析的 SQL 查询语句导向型预训练模型 STAR。截至目前,STAR 已连续 10 个月占据 SParC 和 CoSQL 两大榜单的第一名。论文已被自然语言处理领域国际会议 EMNLP 2022 Findings 接收。如下为一个上下文依赖的多轮 Text-to-SQL 解析例子。

推荐:登顶对话式语义解析国际权威榜单 SParC 和 CoSQL,全新多轮对话表格知识预训练模型 STAR 解读。

论文 2:Cell-type-specific prediction of 3D chromatin organization enables high-throughput in silico genetic screening


摘要:本文首先提出了新型多模态机器学习模型 C.Origami 来预测特定细胞类型的染色质构象,并基于遗传筛选的原理提出了全新的高通量计算遗传筛选 (in silico genetic screening, ISGS) 方法。C.Origami 模型分为三个部分,处理并压缩 DNA 及基因组信息的编码器,Transformer 中间层和输出 Hi-C 解码器。

推荐:Nature 子刊 | 谭济民、夏波等提出基因组构象预测模型及高通量计算遗传筛选方法。

论文 3:Cognitive Physics - The Enlightenment by Schrödinger, Turing, Wiener and Beyond


摘要:2023 年 1 月 3 日,著名人工智能学家,中国工程院院士、欧亚科学院院士,中国人工智能学会名誉理事长李德毅在 Science 伙伴期刊 Intelligent Computing 发表前瞻性观点论文《认知物理学 —— 薛定谔、图灵和维纳的启示和超越》。论文回顾了 20 世纪上半叶,控制论之父维纳(1894-1964)、量子力学之父薛定谔(1887-1961)和人工智能之父图灵(1912-1954)三位杰出学者为人类留下的五篇经典之作,并受其启发,展望未来以负熵为生、可交互、会学习、自成长的智能机器,为今后机器智能的发展奠定了基础和方向。下图为可交互、会学习、自成长的机器运行流程。

推荐:李德毅院士前瞻性观点论文:《认知物理学 —— 薛定谔、图灵和维纳的启示和超越》。

论文 4:Performance of ChatGPT on USMLE: Potential for AI-Assisted Medical Education Using Large Language Models


摘要:ChatGPT 自发布以来一直受到关注,被认为是当前最强大的语言模型之一。它的文本生成能力已经不输人类,甚至有机器学习顶会为此明令禁止研究者使用 ChatGPT 编写论文。

但是近期有一篇论文居然在作者一栏明确署名 ChatGPT,这是怎么回事?这篇论文是发表在医学研究论文平台 medRxiv 上的《Performance of ChatGPT on USMLE: Potential for AI-Assisted Medical Education Using Large Language Models》,ChatGPT 是论文的第三作者。

推荐:一位论文作者火了,ChatGPT 等大型语言模型何时能成为论文合著者?

论文 5:Mastering Diverse Domains through World Models


摘要:通用智能需要解决多个领域的任务。人们认为强化学习算法具有这种潜力,但它一直受到为新任务调整所需资源和知识的阻碍。在 DeepMind 的一项新研究中,研究人员展示了基于世界模型的通用可扩展的算法 DreamerV3,它在具有固定超参数的广泛领域中优于以前的方法。

DreamerV3 符合的领域包括连续和离散动作、视觉和低维输入、2D 和 3D 世界、不同的数据量、奖励频率和奖励等级。值得一提的是,DreamerV3 是第一个在没有人类数据或主动教育的情况下从零开始在《我的世界》(Minecraft)中收集钻石的算法。研究人员表示,这样的通用算法可以使强化学习得到广泛应用,并有望扩展到硬决策问题。

推荐:AI 从零开始学会玩《我的世界》,DeepMind AI 通用化取得突破。

论文 6:ParkPredict+: Multimodal Intent and Motion Prediction for Vehicles in Parking Lots with CNN and Transformer


摘要:Dragon Lake Parking (DLP) 数据集以无人机正射航拍视角,提供了大量经过标注的高清 4K 视频和轨迹数据,记录了在停车场环境内,不同类型的车辆、行人和自行车的运动及交互行为。数据集时长约 3.5 小时,采样率为 25Hz,覆盖区域面积约为 140 m x 80 m,包含约 400 个停车位,共记录了 5188 个主体。数据集提供两种格式:JSON 和原视频 + 标注,可服务的研究方向包括:大规模高精度目标识别和追踪、空闲车位检测、车辆和行人的行为和轨迹预测、模仿学习等。

推荐:伯克利开源首个泊车场景下的高清数据集和预测模型,支持目标识别、轨迹预测。

论文 7:ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders


摘要:来自 KAIST、Meta、纽约大学的研究者(包括 ConvNeXt 一作刘壮、ResNeXt 一作谢赛宁)提出在同一框架下共同设计网络架构和掩码自编码器,这样做的目的是使基于掩码的自监督学习能够适用于 ConvNeXt 模型,并获得可与 transformer 媲美的结果。

推荐:ConvNeXt V2 来了,仅用最简单的卷积架构,性能不输 Transformer。

相关文章
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
Agent Laboratory 是由 AMD 和约翰·霍普金斯大学联合推出的自主科研框架,基于大型语言模型,能够加速科学发现、降低成本并提高研究质量。
248 23
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
|
1月前
|
人工智能
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
《Scaling Laws for Precision》论文提出“精度感知”的扩展理论,将精度纳入模型发展的核心考量,弥补了传统AI模型发展理论忽视精度的不足。研究发现低精度训练会降低模型的有效参数计数,影响性能,并预测了低精度训练和后训练量化带来的损失。作者通过大量实验验证了理论的可靠性和有效性,为计算资源有限情况下如何平衡模型规模和精度提供了新思路。然而,该研究也引发了关于精度与性能权衡复杂性的争议。
75 27
|
5月前
|
人工智能 自动驾驶 机器人
吴泳铭:AI最大的想象力不在手机屏幕,而是改变物理世界
过去22个月,AI发展速度超过任何历史时期,但我们依然还处于AGI变革的早期。生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。
8875 73
|
4月前
|
人工智能 自然语言处理 算法
几款宝藏级AI阅读工具推荐!论文分析、文档总结必备神器!
【10月更文挑战第8天】几款宝藏级AI阅读工具推荐!论文分析、文档总结必备神器!
310 1
|
5月前
|
人工智能 开发者
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9
98 4
|
9月前
|
机器学习/深度学习 数据采集 人工智能
KAN核心团队震撼力作!MIT华人用AI首次发现物理学全新方程
【5月更文挑战第21天】MIT华人科研团队运用AI开发OptPDE工具,首次找到3个新可积PDE家族,增强人类在物理学方程发现中的能力。OptPDE通过优化PDE系数最大化守恒量,CQFinder自动识别守恒量,二者协同工作,重新发现KdV方程并揭示新方程的特殊性质。该研究展示AI与人类科学家合作的潜力,为复杂问题解决开辟新路径。论文链接:https://arxiv.org/abs/2405.04484
138 3
|
9月前
|
机器学习/深度学习 人工智能 数据挖掘
ICLR 49.9%论文疑有AI审稿
【5月更文挑战第20天】ICLR会议上一篇研究引发关注,推测近50%的论文可能由AI进行审稿,挑战传统审稿流程。研究者运用机器学习分析历史审稿数据,发现可能的AI审稿模式。该研究提出AI审稿可减轻审稿人负担,提高效率,但也面临证据不足、理解复杂学术概念限制及审稿行为多样性等问题。学术界需谨慎评估AI在审稿中的角色,以确保质量和公正性。[论文链接](https://arxiv.org/abs/2405.02150)
127 1
|
9月前
|
人工智能
AI大咖说-如何评价论文的创新性
《AI大咖说》探讨论文创新性,强调新意、有效性和领域研究问题的重要性。创新点在于用新颖方法有效解决研究问题。评价公式:价值=问题大小*有效性*新意度。该观点源于《跟李沐学AI》视频,提供1-100分评分标准,助力评估论文价值。5月更文挑战第14天
132 3
|
28天前
|
人工智能 算法 前端开发
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架,支持多设备连接、高效模型集成,助力开发者快速构建复杂的多模态代理应用。
189 72
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
|
14天前
|
人工智能 自然语言处理 搜索推荐
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
89 24
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人