7 Papers & Radios | 中文大规模跨模态新基准Zero;AI与冷冻电镜揭示原子级NPC结构(1)

简介: 7 Papers & Radios | 中文大规模跨模态新基准Zero;AI与冷冻电镜揭示原子级NPC结构
本周主要论文包括奇虎360人工智能研究院和清华大学联合发布的大规模中文跨模态基准数据集 Zero,以及 Science 封面特刊的五篇 AI 帮助揭示核孔复合体结构的论文


目录:

  1. AI-based structure prediction empowers integrative structural analysis of human nuclear pores
  2. Structure of cytoplasmic ring of nuclear pore complex by integrative cryo-EM and AlphaFold
  3. Quantum computational advantage with a programmable photonic processor
  4. Rethinking Graph Neural Networks for Anomaly Detection
  5. Zero and R2D2: A Large-scale Chinese Cross-modal Benchmark and A Vision-Language Framework
  6. Siamese Image Modeling for Self-Supervised Vision Representation Learning
  7. FlowBot3D: Learning 3D Articulation Flow to Manipulate Articulated Objects
  8. ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)


论文 1:AI-based structure prediction empowers integrative structural analysis of human nuclear pores


摘要:虽然核孔复合体(NPC)介导核质转运,它们错综复杂的 120 兆道尔顿架构仍未完全得到了解。马克斯・普朗克生物物理研究所等机构的研究者报告了具有显式膜和多构象状态的人类 NPC 支架的 70 兆道尔顿模型。他们将基于 AI 的结构预测与原位和细胞冷冻电子断层扫描、综合建模相结合。结果表明,接头核孔蛋白在亚复合体内和亚复合体之间组织支架,以建立高阶结构。微秒长的分子动力学模拟表明,支架不需要稳定内外核膜融合,而是扩大中心孔。他们举例阐释了如何将基于 AI 的建模与原位结构生物学相结合,以了解跨空间组织级别的亚细胞结构。

人类 NPC 支架架构的 70 兆道尔顿模型。

推荐:新研究将基于 AI 的结构预测与原位和细胞冷冻电子断层扫描、综合建模相结合。

论文 2:Structure of cytoplasmic ring of nuclear pore complex by integrative cryo-EM and AlphaFold


摘要:哈佛医学院等机构的研究者使用单粒子冷冻电子显微镜和 AlphaFold 预测,从非洲爪蟾卵母细胞中确定了近乎完整的 NPC 细胞质环结构。具体地,他们使用 AlphaFold 预测核孔蛋白的结构,并使用突出的二级结构密度作为指导来适应中等分辨率的地图。某些分子相互作用通过使用 AlphaFold 的复杂预测进一步得到建立或确认。

研究者确定了五份 Nup358 的结合模式,它是最大的 NPC 亚基,具有用于转运的 Phe-Gly 重复序列。他们预测 Nup358 包含一个卷曲螺旋结构域,可以提供活性以帮助它在一定条件下作为 NPC 形成的成核中心。

非洲爪蟾 NPC 细胞质环的 Cryo-EM 结构。

推荐:研究者使用 DeepMind 的 AlphaFold 来预测核孔蛋白的结构。

论文 3:Quantum computational advantage with a programmable photonic processor


摘要:在一项新研究《可编程光子处理器的量子计算优越性》中,多伦多量子计算初创公司 Xanadu 推出了全新的设备 Borealis,它可能是第一台完全可编程的光子量子计算机。这项研究 6 月 1 日正式发表在 Nature 杂志。

在 Borealis 中,量子比特由所谓的「压缩态」构成,由光脉冲中的多个光子的叠加组成。由于量子物理学的超现实性质,传统量子比特能够以一种称为叠加的状态存在,它们可以表示数据的 0 或 1,而压缩态能够以 0、1、2、3 或更多的状态存在。它能够生成多达 216 个压缩光脉冲序列。「重要的是要认识到 Borealis 并不等同于 216 量子比特的传统设备。由于它使用压缩态的量子比特,它处理的量子任务与基于超导电路量子比特或离子阱的设备不同。」Lavoie 说。

来自完全可编程光子处理器的高维 GBS。

GBS 设备的实验验证。

相对于真值的基准。

推荐:首台完全可编程光量子计算机面世:超过最强超算富岳 7.8 万亿倍。

论文 4:Rethinking Graph Neural Networks for Anomaly Detection


摘要:图神经网络(GNN)被广泛应用于结构化数据的异常检测,例如社交网络恶意账号检测、金融交易欺诈检测等。香港科技大学和斯坦福大学首次从谱域的角度(即图拉普拉斯矩阵的谱分解)分析了异常数据可能造成的影响。

他们的核心发现是:异常数据将导致频谱能量出现 “右移” 现象,即频谱能量分布从低频向高频移动。基于这一发现,他们又提出了 Beta 小波图神经网络(BWGNN)。它拥有多个具有局部性的带通滤波器,能够更好捕获 “右移” 产生的高频异常信息。在四个大规模图异常检测数据集上,BWGNN 的性能均优于现有的模型。

传统异常检测与面向图的异常检测任务对比。

频谱能量 “右移” 现象的可视化。

热核小波与 Beta 核小波在谱域(左)和空域(右)上的对比,Beta 函数具有更好的带通与局部性质。

推荐:基于结构化数据的异常检测再思考:我们究竟需要怎样的图神经网络?入选 ICML 2022

论文 5:Zero and R2D2: A Large-scale Chinese Cross-modal Benchmark and A Vision-Language Framework


摘要:最近,奇虎 360 人工智能研究院和清华大学的研究者在其最新论文中重点关注了大规模视觉语言数据集和跨模态表征学习模型。研究者提出了一个大规模中文跨模态基准数据集 Zero,它包含了两个被称为 Zero-Corpus 的预训练数据集和五个下游任务数据集,一定程度上填补了中文图文跨模态领域数据集的空白。
进一步,研究者们还提出了一个视觉语言预训练框架 R2D2,用于大规模跨模态学习,基于所提出的 Zero-Corpus 数据集进行预训练,并在多个下游任务上进行测试,R2D2 取得多项超越 SOTA 的结果。上述数据集和模型,均已开源。

研究者还尝试用更大的 2.5 亿内部数据集训练 R2D2 模型,相对 2300 万数据,模型效果依然有显著提升。特别是在零样本任务上,相对此前的 SOTA,在 Flickr30k-CN 数据集上,R@M 提升到 85.6%(提升了 4.7%),在 COCO-CN 数据集上,R@M 提升到 80.5%(提升了 5.4%),在 MUGE 数据集上,R@M 提升到 69.5%(提升了 6.3%)。

提出框架的示意图。

Zero-Corpus 图文对示例。

ITM 任务上的性能。

推荐:从 50 亿图文中提取中文跨模态新基准 Zero,奇虎 360 全新预训练框架超越多项 SOTA。


相关文章
|
3月前
|
人工智能 搜索推荐
写歌词的技巧和方法:塑造完美歌词结构的艺术,妙笔生词AI智能写歌词软件
歌词是音乐的灵魂,其结构艺术至关重要。开头需引人入胜,主体部分无论是叙事还是抒情,都应层次分明、情感丰富,结尾则需升华或留白,给人以深刻印象。《妙笔生词智能写歌词软件》提供多种AI辅助功能,助你轻松创作完美歌词,成为音乐创作的得力助手。
|
3月前
|
人工智能
歌词结构的巧妙安排:写歌词的方法与技巧解析,妙笔生词AI智能写歌词软件
歌词创作是一门艺术,关键在于巧妙的结构安排。开头需迅速吸引听众,主体部分要坚实且富有逻辑,结尾则应留下深刻印象。《妙笔生词智能写歌词软件》提供多种 AI 功能,帮助创作者找到灵感,优化歌词结构,写出打动人心的作品。
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
近年来,大型语言模型(LLM)的内部运作机制备受关注。麻省理工学院的研究人员在论文《The Geometry of Concepts: Sparse Autoencoder Feature Structure》中,利用稀疏自编码器(SAE)分析LLM的激活空间,揭示了其丰富的几何结构。研究发现,特征在原子、大脑和星系三个尺度上展现出不同的结构,包括晶体结构、中尺度模块化结构和大尺度点云结构。这些发现不仅有助于理解LLM的工作原理,还可能对模型优化和其他领域产生重要影响。
58 25
|
10天前
|
人工智能 数据挖掘 BI
结构化表格也成模态!浙大TableGPT2开源,最强表格AI问世
在AI快速发展中,大型语言模型(LLMs)如GPTs等展现了巨大潜力。然而,表格数据整合这一关键领域发展不足。浙江大学提出TableGPT2,使用593.8K张表格和2.36M查询-表格-输出三元组进行预训练和微调。该模型创新性地引入了表格编码器,增强了处理模糊查询、缺失列名和不规则表格的能力。TableGPT2在23个基准测试指标上表现出色,7B模型性能提升35.20%,72B模型提升49.32%。其开源代码和模型为社区提供了强大的研究工具。
46 12
|
23天前
|
人工智能 数据挖掘
AI长脑子了?LLM惊现人类脑叶结构并有数学代码分区,MIT大牛新作震惊学界!
麻省理工学院的一项新研究揭示了大型语言模型(LLM)内部概念空间的几何结构,与人脑类似。研究通过分析稀疏自编码器生成的高维向量,发现了概念空间在原子、大脑和星系三个层次上的独特结构,为理解LLM的内部机制提供了新视角。论文地址:https://arxiv.org/abs/2410.19750
67 12
|
2月前
|
人工智能 安全 数据挖掘
远离生成式AI大乱斗,SAS公司揭示亚太区千亿AI市场蓝图
远离生成式AI大乱斗,SAS公司揭示亚太区千亿AI市场蓝图
|
2月前
|
人工智能
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【10月更文挑战第21天】普林斯顿大学研究人员提出了CORE-Bench,一个基于计算可重复性的AI代理基准,涵盖计算机科学、社会科学和医学领域的270个任务。该基准旨在评估AI代理在科学研究中的准确性,具有多样性、难度级别和现实相关性等特点,有助于推动AI代理的发展并提高计算可重复性。
60 4
|
3月前
|
人工智能
写歌词的技巧和方法:构建独特歌词结构的策略,妙笔生词AI智能写歌词软件
歌词创作如同搭建艺术殿堂,独特的歌词结构是其基石。掌握构建策略,让你的歌词脱颖而出。开头营造神秘氛围或出人意料的情感,主体部分采用倒叙、插叙或融合矛盾情感,结尾带来情感反转或深邃思考。《妙笔生词智能写歌词软件》提供 AI 智能写词、押韵优化等功能,助你轻松获取灵感,打造独特歌词结构。
|
3月前
|
人工智能
精通歌词结构技巧:写歌词的方法与实践,妙笔生词AI智能写歌词软件
歌词创作是音乐的灵魂,掌握其结构技巧至关重要。开头需迅速吸引听众,主体部分需结构清晰、情感丰富,结尾则要余韵悠长。无论是叙事还是抒情,妙笔生词智能写歌词软件都能助你一臂之力,提供AI智能创作、优化及解析等多功能支持,助你轻松驾驭歌词创作。
|
3月前
|
人工智能
如何布局歌词结构:写歌词的技巧大公开,妙笔生词AI智能写歌词软件
在歌词创作中,结构布局如同建筑的骨架,决定歌词的稳固与美感。本文揭示了歌词结构布局的奥秘,从吸引人的开头、核心的中间部分到点睛的结尾,帮助你写出动人歌词。此外,推荐使用《妙笔生词智能写歌词软件》,其多种 AI 功能可助你一臂之力。