每日学术速递2.14

简介: 尽管最近几个两阶段的原型网络在少有的命名实体识别(NER)任务中取得了成功,但在跨度检测阶段检测出的错误跨度过大以及在类型分类阶段原型不准确和不稳定仍然是具有挑战性的问题。在本文中,我们提出了一个新颖的类型感知分解框架

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理


Subjects: cs.CL


1.Type-Aware Decomposed Framework for Few-Shot Named Entity Recognition

adc074dc7c781444cadb88243aa9a1cc.png

标题:识别少数命名实体的类型感知分解框架

作者:Yongqi Li, Tieyun Qian

文章链接:https://arxiv.org/abs/2302.06397v1

项目代码:https://github.com/liyongqi2002/TadNER

7620441e639f7cb9d0241e9f11ee17fe.png

摘要:

       尽管最近几个两阶段的原型网络在少有的命名实体识别(NER)任务中取得了成功,但在跨度检测阶段检测出的错误跨度过大以及在类型分类阶段原型不准确和不稳定仍然是具有挑战性的问题。在本文中,我们提出了一个新颖的类型感知分解框架,即TadNER,来解决这些问题。我们首先提出了一个类型感知的跨度过滤策略,通过去除那些在语义上远离类型名称的跨度来过滤掉错误的跨度。然后,我们提出了一种类型意识的对比学习策略,通过共同利用支持样本和类型名称作为参考,构建更准确和稳定的原型。在各种基准上进行的大量实验证明,我们提出的TadNER框架产生了新的最先进的性能。

42e12a47dd072c3224f254e4ba74b589.png

d02294ec8f98e35cb687152b16157f6a.png

d04dbbfdd285c52a545535141db14d56.png

Subjects: cs.CV


2.Adjacent-level Feature Cross-Fusion with 3D CNN for Remote Sensing Image Change Detection

76e0d129b1fa0b80e4a0d06a1e3ce970.png

标题:用三维CNN进行遥感图像变化检测的相邻级特征交叉融合

作者:Yuanxin Ye, Mengmeng Wang, Liang Zhou, Guangyang Lei, Jianwei Fan, Yao Qin

文章链接:https://arxiv.org/abs/2302.05109v1

项目代码:https://github.com/wm-githuber/afcf3d-net

a315264b857249a11f29c483b654937d.png

摘要:

       近年来,利用遥感图像进行基于深度学习的变化检测受到越来越多的关注。然而,如何有效地提取和融合双时空图像的深层特征以提高变化检测的准确性仍是一个挑战。为了解决这个问题,本文提出了一种新型的具有三维卷积的邻接级特征融合网络(名为AFCF3D-Net)。首先,通过三维卷积的内部融合特性,我们设计了一种新的特征融合方式,可以同时提取和融合双时态图像的特征信息。然后,为了弥补低级特征和高级特征之间的语义差距,我们提出了相邻级特征交叉融合(AFCF)模块,以聚合相邻级之间互补的特征信息。此外,引入密集跳过连接策略,以提高像素级预测的能力和结果中变化对象的紧凑性。最后,提出的AFCF3D-Net在三个具有挑战性的遥感变化检测数据集上得到了验证。武汉建筑数据集(WHU-CD)、LEVIR建筑数据集(LEVIR-CD)和中山大学(SYSU-CD)。定量分析和定性比较的结果表明,与其他最先进的变化检测方法相比,提出的AFCF3D-Net取得了更好的性能。

ffc93fb9960598ad4244b1649a9a4052.png

73e1e93ae83db978d10062a54184ee7d.png

c5262a58bdcc2efcbfc4c3173f4f15f6.png

3.CEN-HDR: Computationally Efficient neural Network for real-time High Dynamic Range imaging

4086b699bb9054ecaa0ca66507640a80.png

标题:CEN-HDR:用于实时高动态范围成像的计算效率神经网络

作者:Steven Tel, Barthélémy Heyrman, Dominique Ginhac

文章链接:https://arxiv.org/abs/2302.05213v1

项目代码:https://github.com/steven-tel/cen-hdr

000fcec64827e7a82729fa30f088ddb7.png

摘要:

       高动态范围(HDR)成像仍然是现代数字摄影中的一项挑战性任务。最近的研究提出了提供高质量采集的解决方案,但其代价是非常多的操作和缓慢的推理时间,这使得这些解决方案无法在轻量级实时系统上实施。在本文中,我们提出了CEN-HDR,一个新的计算效率高的神经网络,通过提供一个基于光注意机制和亚像素卷积操作的新型架构,用于实时HDR成像。我们还通过使用知识蒸馏法进行网络压缩,提供了一种高效的训练方案。我们进行了广泛的定性和定量比较,表明我们的方法在图像质量方面产生了有竞争力的结果,同时比最先进的解决方案更快,使其能够在实时限制下实际部署。实验结果表明,我们的方法在Kalantari2017数据集上获得了43.04 mu-PSNR的分数,使用Macbook M1 NPU的帧速率为33 FPS。

88f4c02d63f470f63cb44fd5fbb7e9ba.png

23d762d3d96f7101553310f389146d41.png

60caaf4af5cd84bd02796fe2a35b12ad.png

目录
相关文章
|
机器学习/深度学习 自然语言处理 数据可视化
每日学术速递4.19
最近,基于端到端变压器的检测器 (DETR) 取得了显着的性能。然而,DETRs 的高计算成本问题尚未得到有效解决,限制了它们的实际应用并阻止它们充分利用无后处理的好处,例如非最大抑制 (NMS)。在本文中,我们首先分析了现代实时目标检测器中 NMS 对推理速度的影响,并建立了端到端速度基准
159 0
|
机器学习/深度学习 存储 编解码
每日学术速递2.20
将强大的生成去噪扩散模型 (DDM) 应用于图像语义编辑等下游任务通常需要微调预训练 DDM 或学习辅助编辑网络。在这项工作中,我们通过仅通过冻结 DDM 优化去噪轨迹,在各种应用程序设置上实现了 SOTA 语义控制性能。
92 0
|
机器学习/深度学习 编解码 自然语言处理
每日学术速递3.29
由于模型容量有限,纯基于 MLP 的神经辐射场(基于 NeRF 的方法)在大型场景上经常会出现渲染模糊的欠拟合问题。最近的方法提出在地理上划分场景并采用多个子 NeRF 分别对每个区域进行建模,从而导致训练成本和子 NeRF 的数量随着场景的扩展而线性增加。
139 0
|
机器学习/深度学习 人工智能 自然语言处理
每日学术速递4.30
具有指令微调的大型语言模型 (LLM) 展示了卓越的生成能力。然而,这些模型是资源密集型的。为了缓解这个问题,我们探索从指令调整的 LLM 中提炼知识到更小的 LLM。为此,我们基于现有指令和新生成的指令精心开发了大量 2.58M 指令集。
116 0
|
机器学习/深度学习 存储 自然语言处理
每日学术速递4.29
我们提出了一种将点云渲染为表面的新方法。所提出的方法是可区分的,不需要特定场景的优化。这种独特的功能支持开箱即用的表面法线估计、渲染房间尺度点云、逆向渲染和全局照明光线追踪。与专注于将点云转换为其他表示(例如曲面或隐式函数)的现有工作不同,我们的关键思想是直接推断光线与给定点云表示的底层表面的交点。
114 0
|
机器人
每日学术速递4.27
我们研究如何使用 Transformers 构建和训练用于机器人决策的空间表示。特别是,对于在各种环境中运行的机器人,我们必须能够快速训练或微调机器人感觉运动策略,这些策略对杂波具有鲁棒性、数据效率高,并且可以很好地泛化到不同的环境。
107 0
|
机器学习/深度学习 人工智能 自然语言处理
每日学术速递5.8
最近的 AI 助理代理,例如 ChatGPT,主要依靠带有人工注释的监督微调 (SFT) 和来自人类反馈的强化学习 (RLHF) 来使大型语言模型 (LLM) 的输出与人类意图保持一致,确保它们是乐于助人、合乎道德且可靠。然而,由于获得人工监督的高成本以及质量、可靠性、多样性、自我一致性和不良偏见等相关问题
163 0
|
机器学习/深度学习 人工智能 自然语言处理
每日学术速递5.4
尽管越来越多地采用混合现实和交互式 AI 代理,但这些系统在看不见的环境中生成高质量的 2D/3D 场景仍然具有挑战性。通常的做法需要部署一个 AI 代理来收集大量数据,以便为每个新任务进行模型训练。对于许多领域来说,这个过程是昂贵的,甚至是不可能的。
125 0
|
机器学习/深度学习 存储 自然语言处理
每日学术速递4.17
扩散模型已被证明在生成高质量图像方面非常有效。然而,使大型预训练扩散模型适应新领域仍然是一个开放的挑战,这对于实际应用至关重要。本文提出了 DiffFit,这是一种参数高效策略,用于微调大型预训练扩散模型,从而能够快速适应新领域。DiffFit 非常简单,仅微调特定层中的偏差项和新添加的缩放因子
124 0
|
机器学习/深度学习 编解码 自然语言处理
每日学术速递4.11
最近关于从姿势图像进行 3D 重建的工作表明,使用深度神经网络直接推断场景级 3D 几何结构而无需迭代优化是可行的,显示出非凡的前景和高效率。
89 0
下一篇
无影云桌面