今日热门论文推荐:MM-Eureka、FedRand、EasyControl、FEA-Bench

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 由Skolkovo科技学院等机构提出的这项研究,聚焦于人工智能文本检测(ATD)的可解释性提升。利用Sparse Autoencoders(SAE)从Gemma-2-2b模型中提取特征,该工作揭示了现代大语言模型(LLM)与人类文本的差异,尤其是在信息密集领域,展现了独特的写作风格,为ATD提供了新的见解和方法。

v2-55ac1631fa64ba3d35b4fb276a3fe9d1_1440w.gif

作者:InternLM、Qwen 等 LLM每日一览热门论文版,顶会投稿选题不迷惘。快来看看由「机智流」和「ModelScope」社区推荐的今日热门论文吧!


Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders

论文链接:

https://modelscope.cn/papers/123418  

简要介绍:

由Skolkovo科技学院等机构提出的这项研究,聚焦于人工智能文本检测(ATD)的可解释性提升。利用Sparse Autoencoders(SAE)从Gemma-2-2b模型中提取特征,该工作揭示了现代大语言模型(LLM)与人类文本的差异,尤其是在信息密集领域,展现了独特的写作风格,为ATD提供了新的见解和方法。

核心图片:

image.png  


SEAP: Training-free Sparse Expert Activation Pruning Unlock the Brainpower of Large Language Models

论文链接:

https://modelscope.cn/papers/125314  

简要介绍:

中国人民大学等团队提出了SEAP,一种无需训练的剪枝方法,通过选择性地保留与任务相关的参数,降低大语言模型推理成本。实验表明,SEAP在50%剪枝率下超越WandA和FLAP超20%,展现了高效性和可扩展性,为优化大规模LLM开辟了新路径。

核心图片:

image.png  


MM-Eureka: Exploring Visual Aha Moment with Rule-based Large-scale Reinforcement Learning

论文链接:

https://modelscope.cn/papers/125149  

简要介绍:

上海AI实验室等机构推出了MM-Eureka,将基于规则的大规模强化学习(RL)扩展到多模态推理。该模型在多模态数学任务中展现了视觉“顿悟时刻”,数据效率远超传统方法,且开源了完整pipeline,推动了多模态推理研究。

核心图片:


image.png


Taking Notes Brings Focus? Towards Multi-Turn Multimodal Dialogue Learning

论文链接:

https://modelscope.cn/papers/125186  

简要介绍:

北京大学等团队提出了MMDiag数据集和DiagNote模型,旨在提升多模态大语言模型(MLLM)在多轮对话中的推理能力。受人类视觉处理启发,DiagNote通过“深思”和“注视”模块协同工作,显著提升了多模态信息整合能力。

核心图片:

image.png  


Automated Movie Generation via Multi-Agent CoT Planning

论文链接:

https://modelscope.cn/papers/124513  

简要介绍:

新加坡国立大学Show Lab提出了MovieAgent,通过多智能体Chain of Thought(CoT)规划实现自动化电影生成。给定剧本和角色库,该框架能生成连贯的多场景长视频,显著减少人工干预,开创了电影生成新范式。

核心图片:  

image.png


FedRand: Enhancing Privacy in Federated Learning with Randomized LoRA Subparameter Updates

论文链接:

https://modelscope.cn/papers/124596  

简要介绍:

由韩国研究团队开发的FedRand,通过随机选择LoRA子参数更新,增强了联邦学习(FL)的隐私保护。仅将非私有参数上传至服务器,该方法有效抵御成员推理攻击,同时保持高准确率。


EasyControl: Adding Efficient and Flexible Control for Diffusion Transformer

论文链接:

https://modelscope.cn/papers/124672  

简要介绍:

Tiamat AI等团队提出了EasyControl,为Diffusion Transformer(DiT)引入高效灵活的控制框架。通过轻量级LoRA模块和因果注意力机制,该方法提升了图像生成的效率和多样性,适用于多种应用场景。

核心图片:

image.png


FEA-Bench: A Benchmark for Evaluating Repository-Level Code Generation for Feature Implementation

论文链接:

https://modelscope.cn/papers/125249  

简要介绍:

微软亚洲研究院和北京大学合作推出了FEA-Bench,首个评估LLM在代码库级别增量开发能力的基准。基于83个GitHub仓库的PR数据,该基准揭示了LLM在特征实现任务中的挑战,推动了自动化软件工程研究。

核心图片:

image.png


AlphaDrive: Unleashing the Power of VLMs in Autonomous Driving via Reinforcement Learning and Reasoning

论文链接:

https://modelscope.cn/papers/124998  

简要介绍:

华中科技大学等团队提出了AlphaDrive,将强化学习(RL)和推理能力融入视觉-语言模型(VLM),优化自动驾驶规划。引入GRPO奖励和两阶段训练策略,该方法显著提升了规划性能和安全性。

核心图片:

image.png


SurveyForge: On the Outline Heuristics, Memory-Driven Generation, and Multi-dimensional Evaluation for Automated Survey Writing

论文链接:

https://modelscope.cn/papers/123886  

简要介绍:

上海AI实验室等机构推出了SurveyForge,通过启发式大纲生成和记忆驱动的内容优化,自动化生成高质量综述论文。搭配SurveyBench基准,该框架在结构和引用质量上超越了AutoSurvey等现有工作。

核心图片:

image.png


今热门论文推荐就到这里结束啦,这些论文展现了AI在文本检测、隐私保护、自动驾驶等领域的最新突破,每一项都值得深入探索。喜欢这期内容?别忘了点赞、分享和关注我们,明天见!🌟

-- 完 --

欢迎在「机智流」公众号后台回复「cc」,加入机智流大模型交流群,与我们一起探索 AI 与人类潜能的未来,一起共赴 AI 浪潮!

目录
相关文章
|
10月前
|
PyTorch 算法框架/工具
Bert Pytorch 源码分析:五、模型架构简图 REV1
Bert Pytorch 源码分析:五、模型架构简图 REV1
155 0
|
7月前
|
机器学习/深度学习 传感器 自然语言处理
【博士每天一篇文献-综述】A Systematic Review of Echo State Networks from Design to Application
本文系统回顾了回声状态网络(ESN)从设计到应用的全过程,探讨了其在多个领域的实际应用,并分析了不同结构的ESN模型如经典ESN、DeepESN和组合模型的性能,以及它们在时间序列预测和动态系统建模中的有效性。
91 1
【博士每天一篇文献-综述】A Systematic Review of Echo State Networks from Design to Application
|
10月前
|
机器学习/深度学习 算法 数据挖掘
Sentieon | 每周文献-Benchmark and Method Study-第十九期
Sentieon | 每周文献-Benchmark and Method Study-第十九期
96 0
|
10月前
|
机器学习/深度学习 自然语言处理 PyTorch
Coggle 30 Days of ML(23年7月)任务九:学会Bert基础,transformer库基础使用
Coggle 30 Days of ML(23年7月)任务九:学会Bert基础,transformer库基础使用
|
消息中间件 SQL Kubernetes
DotNet.CAP,或是.NET唯一靠谱的开源分布式框架
DotNet.CAP,或是.NET唯一靠谱的开源分布式框架
752 0
DotNet.CAP,或是.NET唯一靠谱的开源分布式框架
|
存储 Cloud Native 测试技术
多主架构:VLDB 技术论文《Taurus MM: bringing multi-master to the cloud》解读
本文分享自华为云社区《多主创新,让云数据库性能更卓越》,作者: GaussDB 数据库。 华为《Taurus MM: bringing multi-master to the cloud》论文被国际数据库顶会 VLDB 2023 录用,这篇论文里讲述了符合云原生数据库特点的超燃技术。介绍了如何通过各种黑科技减少云原生数据库的网络消耗,进而提升云原生数据库的性能和稳定性。下面就让我们抽丝剥茧,细细品味技术的魅力,揭开华为云数据库多主技术的面纱。 说明:技术论文中的 Taurus 在华为云商用的产品名是 GaussDB (for MySQL),是 GaussDB (for MySQL) 的云原
179 0
|
机器学习/深度学习 算法 数据挖掘
Sentieon | 每周文献-Benchmark and Method Study(基准与方法研究)-第八期
Sentieon | 每周文献-Benchmark and Method Study(基准与方法研究)-第八期
117 0
|
Prometheus Kubernetes Cloud Native
听GPT 讲Prometheus源代码--discovery
听GPT 讲Prometheus源代码--discovery
152 0
|
编解码 数据挖掘 算法框架/工具
ResNet-RS架构复现--CVPR2021
我们的工作重新审视了规范的 ResNet (He et al., 2015),并研究了这三个方面,以试图解开它们。也许令人惊讶的是,我们发现训练和扩展策略可能比架构变化更重要,而且由此产生的 ResNet 与最近最先进的模型相匹配。**我们展示了表现最佳的缩放策略取决于训练方案,并提供了两种新的缩放策略:(1)在可能发生过度拟合的情况下缩放模型深度(否则宽度缩放更可取); (2) 提高图像分辨率的速度比之前推荐的要慢(Tan & Le,2019)**。使用改进的训练和扩展策略,我们设计了一系列 ResNet 架构 **ResNet-RS**,它比 TPU 上的 EfficientNets 快
540 0
ResNet-RS架构复现--CVPR2021
|
网络协议 测试技术 网络安全
loadrunner入门教程(33) -- Analysis图
Analysis一些基本图形的使用
146 0

热门文章

最新文章