文档备案控制台

开发者社区大数据与机器学习文章正文

2024年2月深度学习的论文推荐

2024-02-28 547

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 我们这篇文章将推荐2月份发布的10篇深度学习的论文

Beyond A*: Better Planning with Transformers via Search Dynamics Bootstrapping.

https://arxiv.org/abs/2402.14083

Searchformer是一个基于Transformer架构的人工智能模型，经过训练可以模拟A星寻路算法，在复杂的规划任务中实现更高的效率。它在Sokoban谜题中的表现优于A星，解决问题的准确率为93.7%，所需步骤减少26.8%。

这是一个很有意思的研究，对寻路算法感兴趣的可以仔细研究一下

LongRoPE: Extending LLM Context Window Beyond 2 Million Tokens.

https://arxiv.org/abs/2402.13753

LongRoPE使用位置插值将上下文窗口从256k扩展到2048k。论文在在不同llm和各种长上下文任务中进行的大量实验强调了LongRoPE的有效性。它在4k到2048k的评估长度范围内保持了较低的困惑度，实现了超过90%的passkey检索精度，并在4096上下文窗口内设计的标准基准测试中提供了相当的精度。LongRoPE可以应用于任何基于RoPE嵌入的llm。

ImplicitDeepfake: Plausible Face-Swapping through Implicit Deepfake Generation using NeRF and Gaussian Splatting.

https://arxiv.org/abs/2402.06390v1

这项工作提出了ImplicitDeepfake1可以产生逼真3D化身，这是一种将Deepfake 技术与Gaussian Splatting和神经辐射场(NeRF )混合在一起的新方法。

Skill Set Optimization: Reinforcing Language Model Behavior via Transferable Skills

https://arxiv.org/pdf/2402.03244.pdf

在RL代理之间转移专业知识已被证明是相当困难的。这项工作优化了一套与环境无关的技术，SSO的其泛化性能非常有前途。

Self-Play Fine-Tuning (SPIN)

https://github.com/uclaml/SPIN

论文提出了一种新的微调方法，称为Self-Play Fine-Tuning(SPIN)，它从监督微调模型开始。SPIN的核心是一种自我游戏机制，LLM通过对抗自身实例来完善自己的能力。LLM从之前的迭代中生成训练数据，通过识别这些自生成的响应和从人类注释数据中获得的响应来改进策略。

Real-World Fluid Directed Rigid Body Control via Deep Reinforcement Learning

https://arxiv.org/abs/2402.06102

“Box o Flows”通过引入一个独特的实验系统，在动态的现实环境中测试强化学习(RL)算法，解决了为强化学习(RL)应用程序复制复杂流体动力学的困难。它展示了无模型强化学习算法如何从简单的奖励中产生复杂的行为，通过离线强化学习提高数据效率，并为在复杂系统中更广泛地使用强化学习打开了大门。

World Model on Million-Length Video and Language with RingAttention

模型使用ring attention和经过微调优化的7B个参数模型。它在检索基准上的表现异常准确，优于商用vlm。

Extreme Video Compression with Pre-trained Diffusion Models

https://arxiv.org/abs/2402.08934v1

使用扩散模型来创建一种新的视频压缩技术，该技术可以在低数据速率下产生高质量的视频帧。

Complete Instances Mining for Weakly Supervised Instance Segmentation.

https://arxiv.org/abs/2402.07633v1

研究人员提出了一种新的图像分割方法，该方法仅使用简单的图像标签来识别图像的特定部分，例如狗。通过弱监督实例分割，不仅提高了效率，降低了错误率，还克服了网络识别同一物体多次出现的困难。

ZLUDA

ZLUDA可以在AMD gpu上运行未经修改的CUDA应用程序，

ZLUDA目前虽然是alpha 阶段，但它已被证实可以与各种原生CUDA应用程序一起工作:Geekbench, 3DF Zephyr, Blender, Reality Capture, LAMMPS, NAMD, waifu2x, OpenFOAM,等等。

https://avoid.overfit.cn/post/b21e16feab8247c1946addcf2dc1aa8f

文章标签：

机器学习/深度学习

算法

并行计算

编解码

人工智能

关键词：

深度学习论文

Deephub

目录

相关文章

星辰大海AI领航

|

机器学习/深度学习自然语言处理数据挖掘

【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述

【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述

星辰大海AI领航

551 0 1

Trouble..

|

机器学习/深度学习自然语言处理算法

【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述

事件抽取是从海量文本数据中快速获取事件信息的一项重要研究任务。随着深度学习的快速发展，基于深度学习技术的事件抽取已成为研究热点。文献中提出了许多方法、数据集和评估指标，这增加全面更新调研的需求。

Trouble..

1023 0 1

sp_fyf_2024-24976

|

机器学习/深度学习自然语言处理算法

深度学习-生成式检索-论文速读-2024-09-14（下）

深度学习-生成式检索-论文速读-2024-09-14（下）

sp_fyf_2024-24976

669 0 0

sp_fyf_2024-24976

|

机器学习/深度学习存储自然语言处理

深度学习-生成式检索-论文速读-2024-09-14（上）

深度学习-生成式检索-论文速读-2024-09-14（上）

sp_fyf_2024-24976

738 0 0

sp_fyf_2024-24976

|

机器学习/深度学习搜索推荐算法

深度学习-点击率预估-研究论文2024-09-14速读

深度学习-点击率预估-研究论文2024-09-14速读

sp_fyf_2024-24976

269 0 0

Deephub

|

机器学习/深度学习自然语言处理前端开发

2024年3月最新的深度学习论文推荐

现在已经是3月中旬了，我们这次推荐一些2月和3月发布的论文。

Deephub

895 0 0

AiCharm

|

机器学习/深度学习编解码固态存储

深度学习论文阅读目标检测篇（五）中文版：YOLOv2《 YOLO9000: Better, Faster, Stronger》

与分类和标记等其他任务的数据集相比，目前目标检测数据集是有限的。最常见的检测数据集包含成千上万到数十万张具有成百上千个标签的图像[3][10][2]。分类数据集有数以百万计的图像，数十或数十万个类别[20][2]。

AiCharm

413 0 0

深度学习论文阅读目标检测篇（五）中文版：YOLOv2《 YOLO9000: Better, Faster, Stronger》

-开发达人-

|

机器学习/深度学习自然语言处理

十年来论文量激增，深度学习如何慢慢推开数学推理的门（2）

十年来论文量激增，深度学习如何慢慢推开数学推理的门

-开发达人-

280 0 0

-开发达人-

|

机器学习/深度学习消息中间件人工智能

十年来论文量激增，深度学习如何慢慢推开数学推理的门（1）

十年来论文量激增，深度学习如何慢慢推开数学推理的门

-开发达人-

479 0 0

玩机器学习的章北海-13621

|

机器学习/深度学习自然语言处理算法

深度学习，经典论文盘点！

深度学习，经典论文盘点！

玩机器学习的章北海-13621

337 0 0

大数据与机器学习

热门文章

最新文章

数据库开放权限太危险，又不想写API。DataV给你另外一个选择。

阿里封神谈hadoop生态学习之路

【技术实验】mysql准实时同步数据到Elasticsearch

数据仓库介绍与实时数仓案例

分布式快照算法: Chandy-Lamport

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

吴刚专访--大数据和 MaxCompute 技术和故事

Python+大数据计算平台，PyODPS架构手把手教你搭建

大模型太慢？别急着上 GPU 堆钱：Python + ONNX Runtime 优化推理性能实战指南

日志不是垃圾，是金矿：聊聊基于日志的大规模用户行为建模如何撑起推荐系统

java工具：Long转String（时间毫秒数转日期格式字符串）

Java AQS：JUC 并发体系的底层同步框架基石

Amazon竞品调价实时预警系统：OpenClaw AI Agent + Pangolinfo API 企业级落地实践

java工具：检测一个字符串是否是时间格式

从提取式API到隧道代理：提升爬虫稳定性的5个核心秘籍

LitBuy模式反向海淘系统（欧美淘宝/1688代购）搭建指南

阐述：关键词搜索京东商品列表API接口

C语言深度解析：未定义行为（UB）—— 90%玄学bug的根源

相关课程

更多

高校精品课-复旦大学-机器学习与深度学习

深度学习框架TensorFlow入门

深度学习与自动驾驶

相关电子书

更多

深度学习的最新进展

搜狗深度学习技术在广告推荐领域的应用

深度学习在电商搜索和聊天机器人中的应用

下一篇

ECS账号安全防护最佳实践