每日学术速递4.29

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: 我们提出了一种将点云渲染为表面的新方法。所提出的方法是可区分的,不需要特定场景的优化。这种独特的功能支持开箱即用的表面法线估计、渲染房间尺度点云、逆向渲染和全局照明光线追踪。与专注于将点云转换为其他表示(例如曲面或隐式函数)的现有工作不同,我们的关键思想是直接推断光线与给定点云表示的底层表面的交点。

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理


Subjects: cs.LG


1.A Cookbook of Self-Supervised Learning

44872d75ed30468e0313c85cee4eca56.png

标题:自监督学习食谱

作者:Randall Balestriero, Mark Ibrahim, Vlad Sobal, Ari Morcos, Shashank Shekhar, Tom Goldstein, Florian Bordes, Adrien Bardes

文章链接:https://arxiv.org/abs/2304.12210

141f0f7b4df9a4e17ded3bf4236ea6b3.png

6f6ca8264f7297e62508e6312c6e5829.png

da2ae35719a5ad0fcd26ce17c3d47981.png

摘要:

       自我监督学习,被称为智能的暗物质,是推进机器学习的一条有前途的途径。然而,就像烹饪一样,训练 SSL 方法是一门精致的艺术,入门门槛很高。虽然许多组件都很熟悉,但成功训练 SSL 方法涉及从借口任务到训练超参数的一系列令人眼花缭乱的选择。我们的目标是通过以食谱的形式奠定基础和最新的 SSL 食谱来降低进入 SSL 研究的门槛。我们希望让好奇的研究人员能够在方法领域中导航,了解各种旋钮的作用,并获得探索 SSL 的美妙之处所需的专业知识。

2.Scaling Transformer to 1M tokens and beyond with RMT

b802a06bf98a3af3a41d92b8f4535f41.png


标题:使用 RMT 将 Transformer 扩展到 1M 代币甚至更多

作者:Aydar Bulatov, Yuri Kuratov, Mikhail S. Burtsev

文章链接:https://arxiv.org/abs/2304.11062

e532b71d1209a761f25184bd883f4cd1.png

a7f96585c76a9591e4ee844f323370e3.png

c703f12a8547122300c040620ee515ac.png

052bc5bbe5c34d0f8752011f6e2b0028.png

12162c30b3c34eb6037333f7b0d46a66.png

摘要:

       这份技术报告介绍了循环记忆在扩展 BERT 的上下文长度方面的应用,BERT 是自然语言处理中最有效的基于 Transformer 的模型之一。通过利用 Recurrent Memory Transformer 架构,我们成功地将模型的有效上下文长度增加到前所未有的 200 万个标记,同时保持了较高的记忆检索准确性。我们的方法允许存储和处理局部和全局信息,并通过使用递归使信息在输入序列的片段之间流动。我们的实验证明了我们方法的有效性,它在增强自然语言理解和生成任务中的长期依赖处理以及为内存密集型应用程序实现大规模上下文处理方面具有巨大潜力。

Subjects: cs.CV


3.Pointersect: Neural Rendering with Cloud-Ray Intersection(CVPR 2023)

5e7139637236fb0247f481e1a5e0acde.png

标题:Pointersect:使用云射线相交的神经渲染

作者:Jen-Hao Rick Chang, Wei-Yu Chen, Anurag Ranjan, Kwang Moo Yi, Oncel Tuzel

文章链接:https://arxiv.org/abs/2304.12390

项目代码:https://machinelearning.apple.com/research/pointersect

4613036187b82699da8f83b5dc74a703.png

05269be2c8a3b9b65b181890a5e1f74d.png

a642e3356601fc46f10cee258834075a.png

摘要:

       我们提出了一种将点云渲染为表面的新方法。所提出的方法是可区分的,不需要特定场景的优化。这种独特的功能支持开箱即用的表面法线估计、渲染房间尺度点云、逆向渲染和全局照明光线追踪。与专注于将点云转换为其他表示(例如曲面或隐式函数)的现有工作不同,我们的关键思想是直接推断光线与给定点云表示的底层表面的交点。具体来说,我们训练一组变换器,给定沿光线的少量局部相邻点,提供交点、表面法线和材料混合权重,用于渲染该光线的结果。将问题定位到小社区使我们能够训练一个只有 48 个网格的模型并将其应用于看不见的点云。我们的模型在三个测试集上实现了比最先进的表面重建和点云渲染方法更高的估计精度。当应用于房间规模的点云时,无需任何特定于场景的优化,该模型通过最先进的新颖视图渲染方法实现了具有竞争力的质量。此外,我们展示了渲染和操纵激光雷达扫描点云的能力,例如照明控制和对象插入。

目录
相关文章
|
存储 数据处理 开发工具
用python制作好的软件放手机里
【4月更文挑战第7天】
467 4
|
8月前
|
人工智能 前端开发 程序员
通义灵码2.0 AI 程序员体验
通义灵码AI程序员全面上线,作为国内首个真正落地的AI程序员,支持Qwen2.5-Max等模型并适配VS Code与JetBrains IDEs。它在新功能开发中快速生成代码框架,助力跨语言编程、自动生成单元测试,还能智能分析错误信息提供修复建议。体验活动显示,通义灵码2.0在代码生成、单元测试和跨语言编程上效率显著提升,极大优化开发者工作流程,成为不可或缺的智能助手。
266 3
|
NoSQL 关系型数据库 Redis
高可用和性能:基于ACK部署Dify的最佳实践
本文介绍了基于阿里云容器服务ACK,部署高可用、可伸缩且具备高SLA的生产可用的Dify服务的详细解决方案。
|
存储 消息中间件 JSON
DDD基础教程:一文带你读懂DDD分层架构
DDD基础教程:一文带你读懂DDD分层架构
|
存储 Ubuntu 安全
|
机器学习/深度学习 程序员 编译器
c语言从入门到实战——分支和循环
C语言是结构化的程序设计语言,这里的结构指的是顺序结构、选择结构、循环结构,C语言是能够实 现这三种结构的,其实我们如果仔细分析,我们日常所见的事情都可以拆分为这三种结构或者这三种结构的组合。 我们可以使用 if 、 switch 实现分支结构,使用 for 、 while 、 do while 实现循环结构。
233 0
c语言从入门到实战——分支和循环
|
敏捷开发 测试技术 持续交付
【软件设计师备考 专题 】系统开发准备:选择开发方法
【软件设计师备考 专题 】系统开发准备:选择开发方法
202 0
|
NoSQL MongoDB
【MATLAB】进阶绘图 ( MATLAB 颜色值 | 条形图示例 | 查找对象属性方法 | 修改条形图属性 )(一)
【MATLAB】进阶绘图 ( MATLAB 颜色值 | 条形图示例 | 查找对象属性方法 | 修改条形图属性 )(一)
343 0
【MATLAB】进阶绘图 ( MATLAB 颜色值 | 条形图示例 | 查找对象属性方法 | 修改条形图属性 )(一)
|
Arthas Java 测试技术
Alibaba Arthas 3.1.2版本:增加logger/heapdump/vmoption命令,支持tunnel server
![Arthas](https://alibaba.github.io/arthas/_images/arthas.png) `Arthas`是Alibaba开源的Java诊断工具,深受开发者喜爱。 * Github: https://github.com/alibaba/arthas * 文档:https://alibaba.github.io/arthas Arthas
978 0