今日论文推荐:DeepMesh、TULIP、Cube、STEVE及LEGION

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 由上海 AI 实验室、西安交通大学等机构提出的 φ-Decoding,是一种全新的推理时间优化策略。该工作通过前瞻采样和聚类技术,平衡了探索与利用的关系,显著提升了大语言模型(LLM)的推理性能。实验表明,其在七个基准测试中超越了强基线,且具备跨模型通用性和计算预算扩展性。

5eecdaf48460cde5d5fb57f04567d5924607b27caa4c0b5458e70b814913bc360a414d3de9277d871abf3af1cbd752490a6821246a42478fac60da290331e111f9ef99549683b2f93c7e273e20172cc2b8c2f1031b0cf01bfc653b69905bac42.gif

作者:InternLM、Qwen 等 LLM每日一览热门论文版,顶会投稿不迷惘。快来看看由「机智流」和「ModelScope」社区推荐的论文吧

φ-Decoding: Adaptive Foresight Sampling for Balanced Inference-Time Exploration and Exploitation

论文链接:

https://modelscope.cn/papers/127390

简要介绍:

由上海 AI 实验室、西安交通大学等机构提出的 φ-Decoding,是一种全新的推理时间优化策略。该工作通过前瞻采样和聚类技术,平衡了探索与利用的关系,显著提升了大语言模型(LLM)的推理性能。实验表明,其在七个基准测试中超越了强基线,且具备跨模型通用性和计算预算扩展性。

核心图片:

image.png


DeepMesh: Auto-Regressive Artist-mesh Creation with Reinforcement Learning

论文链接:

https://modelscope.cn/papers/128655

简要介绍:

清华大学、南洋理工大学等团队推出了 DeepMesh,通过自回归方式结合强化学习(RL)优化 3D 网格生成。该工作引入高效预训练策略和直接偏好优化(DPO),生成高质量艺术风格网格,超越了现有技术。

核心图片:

image.png

 

TULIP: Towards Unified Language-Image Pretraining

论文链接:

https://modelscope.cn/papers/128708

简要介绍:

加州大学伯克利分校团队研发的 TULIP,革新了图像-文本对比模型。利用生成数据增强和重建正则化,TULIP 在细粒度视觉任务中表现出色,刷新了 ImageNet-1K 零样本性能纪录。

核心图片:

  image.png

Cube: A Roblox View of 3D Intelligence

论文链接:

https://modelscope.cn/papers/128434

简要介绍:

Roblox 基础 AI 团队提出了 Cube,旨在构建 3D 智能基础模型。该工作通过 3D 形状标记化技术,支持文本到形状、场景生成等应用,迈出了实现 Roblox 体验全自动化的一步。

核心图片:

  image.png

Temporal Regularization Makes Your Video Generator Stronger

论文链接:

https://modelscope.cn/papers/128693

简要介绍:

Everlyn AI 和香港科技大学团队推出的 FluxFlow,通过时间增强优化视频生成的时间一致性和多样性。不需修改架构,仅在数据层面实现显著提升,适用于多种视频生成模型。

核心图片:

  image.png

Efficient Personalization of Quantized Diffusion Model without Backpropagation

论文链接:

https://modelscope.cn/papers/128489

简要介绍:

首尔国立大学团队提出了 ZOODiP,一种无需反向传播的量化扩散模型个性化方法。通过零阶优化和子空间梯度降噪,内存需求降低高达 8.2 倍,同时保持高质量图像生成。

核心图片:

  image.png

Optimizing Decomposition for Optimal Claim Verification

论文链接:

https://huggingface.co/papers/2503.15354  

简要介绍:

圣母大学团队提出了动态分解框架,通过强化学习优化分解策略,提升事实验证的准确性。相比传统方法,验证信心和准确率分别提升 0.07 和 0.12。

核心图片:

  image.png

MetaLadder: Ascending Mathematical Solution Quality via Analogical-Problem Reasoning Transfer

论文链接:

https://modelscope.cn/papers/128431

简要介绍:

上海 AI 实验室团队研发的 MetaLadder,通过类比推理迁移提升 LLM 的数学解题能力。比标准 CoT 方法准确率提高 10.3%,模拟了人类的“举一反三”能力。

核心图片:

  image.png

STEVE: A Step Verification Pipeline for Computer-use Agent Training

论文链接:

https://modelscope.cn/papers/127813

简要介绍:

香港中文大学等团队提出的 STEVE,通过步骤验证管道训练计算机使用代理。结合 GPT-4o 和 KTO 优化,7B 模型在真实桌面环境中表现出色。

核心图片:

  image.png

MusicInfuser: Making Video Diffusion Listen and Dance

论文链接:

https://modelscope.cn/papers/128003

简要介绍:

华盛顿大学团队推出了 MusicInfuser,将视频扩散模型适配音乐生成同步舞蹈视频。无需动作捕捉,仅用轻量适配器即可实现高质量生成。

核心图片:

  image.png

LEGION: Learning to Ground and Explain for Synthetic Image Detection

论文链接:

https://modelscope.cn/papers/128659

简要介绍:

上海 AI 实验室等团队提出的 LEGION,结合 MLLM 实现合成图像检测与解释。不仅提升检测性能,还能指导生成更真实图像,刷新多项基准纪录。

核心图片:

 

image.png

目录
打赏
0
1
1
0
237
分享
相关文章
|
10月前
|
Sentieon | 每周文献-Population Sequencing-第二十三期
Sentieon | 每周文献-Population Sequencing-第二十三期
49 1
3D-Genome 分析|简介(1)
3D-Genome 分析|简介(1)
17 0
3D-Genome 分析|简介(1)
【博士每天一篇文献-算法】Extending stability through hierarchical clusters in Echo State Networks
本文研究了在回声状态网络(ESN)中引入分层聚类结构对网络稳定性的影响,发现通过调整簇内和簇间的连接性及每个簇的主干单元数量,可以扩展谱半径的稳定范围,从而提高网络的稳定性和性能。
59 2
【博士每天一篇文献-算法】Adult neurogenesis acts as a neural regularizer
本文研究了成人神经发生(adult neurogenesis)在大脑学习过程中的作用,发现其作为一种神经调节器能提高学习泛化能力,并通过在卷积神经网络(CNN)中模拟神经发生,证明了其作为正则化手段与传统技术一样有效,甚至在某些方面更优。
59 6
【博士每天一篇论文-综述】Echo State Network Optimization: A Systematic Literature Review
本文综述了74篇关于Echo State Network(ESN)优化的研究文章,指出生物启发方法尤其是粒子群优化(PSO)是ESN参数优化的常用技术,探讨了ESN在不同参数和拓扑结构下的行为特性,同时识别了超参数优化、评估指标和数据集选择等方面的研究空白。
50 3
【博士每天一篇论文-技术综述】Machine Learning With Echo State Networks 一篇系统讲解ESN知识的五星文章
本文是一篇技术报告,全面介绍了回声状态网络(ESNs)的数学模型、属性、意义、训练方法、深度ESN的发展、应用和局限性,并探讨了未来的研究方向,为理解ESNs在机器学习中的应用提供了系统性的综述。
137 3
【博士每天一篇论文-实验分析】Toroidal topology of population activity in grid cells
本文通过同时记录多个网格细胞并应用拓扑数据分析,揭示了这些细胞网络的环面拓扑结构,表明存在一个二维连续吸引子网络,为理解空间编码和网格细胞在导航记忆中的作用提供了新视角。
64 3
【2020-2024持续更新】Echo State Network和储层计算论文汇总!包括经典ESN、DeepESN、组合ESN和综述!
本文汇总了2020至2024年间关于Echo State Network(ESN)和储层计算的研究成果,包括综述、不同模型分类(经典ESN、DeepESN、组合ESN)、开源论文、储层计算相关研究以及ESN在各个领域的应用情况。
131 0

热门文章

最新文章