7 Papers & Radios | 李德毅院士认知物理学前瞻性观点论文;AI从零开始学会玩我的世界

简介: 7 Papers & Radios | 李德毅院士认知物理学前瞻性观点论文;AI从零开始学会玩我的世界

本周论文包括李德毅院士前瞻性观点论文:《认知物理学 —— 薛定谔、图灵和维纳的启示和超越》;AI 从零开始学会玩《我的世界》,DeepMind AI 通用化取得突破。


目录:

1. STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing2. Cell-type-specific prediction of 3D chromatin organization enables high-throughput in silico genetic screening3. Cognitive Physics - The Enlightenment by Schrödinger, Turing, Wiener and Beyond4. Performance of ChatGPT on USMLE: Potential for AI-Assisted Medical Education Using Large Language Models5. Mastering Diverse Domains through World Models6. ParkPredict+: Multimodal Intent and Motion Prediction for Vehicles in Parking Lots with CNN and Transformer7. ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders8. ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)

论文 1:STAR: SQL Guided Pre-Training for Context-dependent Text-to-SQL Parsing


摘要:近期,阿里巴巴达摩院联合中国科学院深圳先进技术研究院提出面向多轮 Text-to-SQL 语义解析的 SQL 查询语句导向型预训练模型 STAR。截至目前,STAR 已连续 10 个月占据 SParC 和 CoSQL 两大榜单的第一名。论文已被自然语言处理领域国际会议 EMNLP 2022 Findings 接收。如下为一个上下文依赖的多轮 Text-to-SQL 解析例子。

推荐:登顶对话式语义解析国际权威榜单 SParC 和 CoSQL,全新多轮对话表格知识预训练模型 STAR 解读。

论文 2:Cell-type-specific prediction of 3D chromatin organization enables high-throughput in silico genetic screening


摘要:本文首先提出了新型多模态机器学习模型 C.Origami 来预测特定细胞类型的染色质构象,并基于遗传筛选的原理提出了全新的高通量计算遗传筛选 (in silico genetic screening, ISGS) 方法。C.Origami 模型分为三个部分,处理并压缩 DNA 及基因组信息的编码器,Transformer 中间层和输出 Hi-C 解码器。

推荐:Nature 子刊 | 谭济民、夏波等提出基因组构象预测模型及高通量计算遗传筛选方法。

论文 3:Cognitive Physics - The Enlightenment by Schrödinger, Turing, Wiener and Beyond


摘要:2023 年 1 月 3 日,著名人工智能学家,中国工程院院士、欧亚科学院院士,中国人工智能学会名誉理事长李德毅在 Science 伙伴期刊 Intelligent Computing 发表前瞻性观点论文《认知物理学 —— 薛定谔、图灵和维纳的启示和超越》。论文回顾了 20 世纪上半叶,控制论之父维纳(1894-1964)、量子力学之父薛定谔(1887-1961)和人工智能之父图灵(1912-1954)三位杰出学者为人类留下的五篇经典之作,并受其启发,展望未来以负熵为生、可交互、会学习、自成长的智能机器,为今后机器智能的发展奠定了基础和方向。下图为可交互、会学习、自成长的机器运行流程。

推荐:李德毅院士前瞻性观点论文:《认知物理学 —— 薛定谔、图灵和维纳的启示和超越》。

论文 4:Performance of ChatGPT on USMLE: Potential for AI-Assisted Medical Education Using Large Language Models


摘要:ChatGPT 自发布以来一直受到关注,被认为是当前最强大的语言模型之一。它的文本生成能力已经不输人类,甚至有机器学习顶会为此明令禁止研究者使用 ChatGPT 编写论文。

但是近期有一篇论文居然在作者一栏明确署名 ChatGPT,这是怎么回事?这篇论文是发表在医学研究论文平台 medRxiv 上的《Performance of ChatGPT on USMLE: Potential for AI-Assisted Medical Education Using Large Language Models》,ChatGPT 是论文的第三作者。

推荐:一位论文作者火了,ChatGPT 等大型语言模型何时能成为论文合著者?

论文 5:Mastering Diverse Domains through World Models


摘要:通用智能需要解决多个领域的任务。人们认为强化学习算法具有这种潜力,但它一直受到为新任务调整所需资源和知识的阻碍。在 DeepMind 的一项新研究中,研究人员展示了基于世界模型的通用可扩展的算法 DreamerV3,它在具有固定超参数的广泛领域中优于以前的方法。

DreamerV3 符合的领域包括连续和离散动作、视觉和低维输入、2D 和 3D 世界、不同的数据量、奖励频率和奖励等级。值得一提的是,DreamerV3 是第一个在没有人类数据或主动教育的情况下从零开始在《我的世界》(Minecraft)中收集钻石的算法。研究人员表示,这样的通用算法可以使强化学习得到广泛应用,并有望扩展到硬决策问题。

推荐:AI 从零开始学会玩《我的世界》,DeepMind AI 通用化取得突破。

论文 6:ParkPredict+: Multimodal Intent and Motion Prediction for Vehicles in Parking Lots with CNN and Transformer


摘要:Dragon Lake Parking (DLP) 数据集以无人机正射航拍视角,提供了大量经过标注的高清 4K 视频和轨迹数据,记录了在停车场环境内,不同类型的车辆、行人和自行车的运动及交互行为。数据集时长约 3.5 小时,采样率为 25Hz,覆盖区域面积约为 140 m x 80 m,包含约 400 个停车位,共记录了 5188 个主体。数据集提供两种格式:JSON 和原视频 + 标注,可服务的研究方向包括:大规模高精度目标识别和追踪、空闲车位检测、车辆和行人的行为和轨迹预测、模仿学习等。

推荐:伯克利开源首个泊车场景下的高清数据集和预测模型,支持目标识别、轨迹预测。

论文 7:ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders


摘要:来自 KAIST、Meta、纽约大学的研究者(包括 ConvNeXt 一作刘壮、ResNeXt 一作谢赛宁)提出在同一框架下共同设计网络架构和掩码自编码器,这样做的目的是使基于掩码的自监督学习能够适用于 ConvNeXt 模型,并获得可与 transformer 媲美的结果。

推荐:ConvNeXt V2 来了,仅用最简单的卷积架构,性能不输 Transformer。

相关文章
|
4月前
|
人工智能 自动驾驶 机器人
吴泳铭:AI最大的想象力不在手机屏幕,而是改变物理世界
过去22个月,AI发展速度超过任何历史时期,但我们依然还处于AGI变革的早期。生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。
7919 73
|
8月前
|
人工智能 NoSQL 安全
MongoDB观点:让生成式AI成为业务增长的新动能,游戏公司可以这样做
游戏公司采用检索增强生成(RAG)技术,如MongoDB Atlas Vector Search,以提高AI输出的准确性和定制化服务。通过灵活的文档数据库如MongoDB Atlas,企业能更好地集成AI,确保数据安全并抓住创新机遇。ChatGPT标志着AI时代的转折点,游戏公司凭借大量数据优势,有望在这一变革中引领行业发展。
2987 3
|
4月前
|
人工智能 开发者
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9
83 4
|
8月前
|
机器学习/深度学习 数据采集 人工智能
KAN核心团队震撼力作!MIT华人用AI首次发现物理学全新方程
【5月更文挑战第21天】MIT华人科研团队运用AI开发OptPDE工具,首次找到3个新可积PDE家族,增强人类在物理学方程发现中的能力。OptPDE通过优化PDE系数最大化守恒量,CQFinder自动识别守恒量,二者协同工作,重新发现KdV方程并揭示新方程的特殊性质。该研究展示AI与人类科学家合作的潜力,为复杂问题解决开辟新路径。论文链接:https://arxiv.org/abs/2405.04484
124 3
|
8月前
|
机器学习/深度学习 人工智能 数据挖掘
ICLR 49.9%论文疑有AI审稿
【5月更文挑战第20天】ICLR会议上一篇研究引发关注,推测近50%的论文可能由AI进行审稿,挑战传统审稿流程。研究者运用机器学习分析历史审稿数据,发现可能的AI审稿模式。该研究提出AI审稿可减轻审稿人负担,提高效率,但也面临证据不足、理解复杂学术概念限制及审稿行为多样性等问题。学术界需谨慎评估AI在审稿中的角色,以确保质量和公正性。[论文链接](https://arxiv.org/abs/2405.02150)
114 1
|
8月前
|
人工智能
AI大咖说-如何评价论文的创新性
《AI大咖说》探讨论文创新性,强调新意、有效性和领域研究问题的重要性。创新点在于用新颖方法有效解决研究问题。评价公式:价值=问题大小*有效性*新意度。该观点源于《跟李沐学AI》视频,提供1-100分评分标准,助力评估论文价值。5月更文挑战第14天
105 3
|
8月前
|
机器学习/深度学习 人工智能
论文介绍:AI击败最先进全球洪水预警系统,提前7天预测河流洪水
【5月更文挑战第4天】研究人员开发的AI模型(基于LSTM网络)成功击败全球最先进的洪水预警系统,能在未设测站流域提前7天预测洪水,显著提升预警时间,降低灾害影响。该模型使用公开数据集,减少了对长期观测数据的依赖,降低了预警系统的成本,有望帮助资源有限的地区。然而,模型的性能可能受特定流域条件影响,泛化能力和预测解释性仍有待改进。[论文链接](https://www.nature.com/articles/s41586-024-07145-1)
183 11
|
8月前
|
机器学习/深度学习 人工智能 算法
AI重建粒子轨迹,发现新物理学
【5月更文挑战第6天】研究人员利用AI重建高能粒子碰撞实验中的粒子轨迹,发现新物理学现象。AI技术解决了传统方法的局限性,揭示了不同寻常的粒子衰变和分布模式,暗示可能存在未知物理过程或粒子相互作用。该研究显示AI在物理学研究中的潜力,但也面临数据需求、计算资源限制和模型可解释性的挑战。[论文链接](https://doi.org/10.7494/csci.2024.25.1.5690)
92 1
|
8月前
|
人工智能 NoSQL 安全
MongoDB观点:让生成式AI成为业务增长的新动能,游戏公司可以这样做
生成式AI技术将深刻地改变人们的生活和企业运营方式
|
8月前
|
机器学习/深度学习 人工智能 算法
AI大咖说-如何有效的读论文
# AI大咖李沐教你高效读论文 李沐,亚马逊资深首席科学家,MXNet框架作者,推荐其在B站的“跟李沐学AI”。他建议读论文分三步:粗读(标题、摘要、结论)、快速浏览(整体理解)和精读(深入细节)。通过这三遍阅读,判断论文是否相关,理解解决问题的方法和实验。5月更文挑战第13天
100 0