7 Papers & Radios | IJCAI 2022杰出论文;苹果2D GAN转3D

简介: 7 Papers & Radios | IJCAI 2022杰出论文;苹果2D GAN转3D

本周重要论文包括 IJCAI 2022 三篇杰出论文,以及苹果将 2D GAN 转换成 3D 的新研究。


目录:

Completeness and Diversity in Depth-First Proof-Number Search with Applications to Retrosynthesis

QCDCL with Cube Learning or Pure Literal Elimination - What is best?

PLURALITYVETO: A Simple Voting Rule Achieving Optimal Metric Distortion

Sliced Recursive Transformer

Generative Multiplane Images: Making a 2D GAN 3D-Aware

Registration based Few-Shot Anomaly Detection

Automatic Quantization for Physics-Based Simulation

ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)


论文 1:Completeness and Diversity in Depth-First Proof-Number Search with Applications to Retrosynthesis


摘要:该研究重新审视了 DFPN(Depth-First Proof-Number Search)算法,这是一种用于解决双人游戏的著名算法。首先,该研究考虑了算法及其变体的完整性,即当存在获胜策略时,算法是否总能找到获胜策略。虽然已知标准版本不完整,但该研究表明与简单阈值控制算法的组合是完整的,从而解决了该领域的一个开放问题。

其次,该研究修改 DFPN 以计算一组不同的解决方案,而不仅仅是一个单一的解决方案。最后,该研究将化学中的这种新变体应用于新目标分子的合成计划(逆合成)。在这个领域中,需要多种解决方案的集合。该研究将文献中的其他修改应用于算法,并根据自然多样性度量表明它优于蒙特卡洛树搜索,这是针对同一问题的另一种著名算法。

证明 DFPN 不完整的图 G。

推荐:IJCAI 2022 杰出论文之一。

论文 2:QCDCL with Cube Learning or Pure Literal Elimination - What is best?


摘要:QCDCL(Quantified conflict-driven clause learning)是求解量化布尔公式的主要方法之一。该研究形式化和研究了 QCDCL 的几个版本,包括立方体学习和 / 或纯字面消除,并通过证明复杂性技术正式比较了生成的求解模型。结果表明,几乎所有的 QCDCL 模型在证明大小(以及求解器运行时间)方面都呈指数级无法比拟,这指向了如何实际实现 QCDCL 的不同正交方式。

QCDCL 证明系统的模拟顺序的哈斯图。

推荐:IJCAI 2022 杰出论文之一。

论文 3:PLURALITYVETO: A Simple Voting Rule Achieving Optimal Metric Distortion


摘要:在度量失真框架中,假设 n 个选民和 m 个候选人共同嵌入一个度量空间,这样选民对离自己越近的候选人的排名就越高。投票规则旨在选出与选民总距离最小的候选人,只给出排名,而不是实际距离。因此,在最坏的情况下,每个确定性规则都会选择一个候选者,其总距离至少是最优规则的三倍,即失真至少为 3。

该研究的主要成果是一个极其简单的投票规则,称为 PLURALITYVETO,它同样实现了 3 的最优失真。每个候选人开始时的得分等于他的第一名投票数。之后分数通过 n 轮否决会下降,在这个过程中,当一个候选人的分数达到 0 时,他就会退出。选民逐个地降低他们在候选人中排名靠后的分数,最后一位候选人获胜。


推荐:IJCAI 2022 杰出论文之一。

论文 4:Sliced Recursive Transformer


摘要:目前 vision transformer 在不同视觉任务上如分类、检测等都展示出了强大的性能,但是其巨大的参数量和计算量阻碍了该模型进一步在实际场景中的应用。基于这个考虑,本文重点研究如何在不增加额外参数量的前提下把模型的表达能力挖掘到极致,同时还要保证模型计算量在合理范围内,从而可以在一些存储容量小,计算能力弱的嵌入式设备上部署。

基于这个动机,Zhiqiang Shen、邢波等研究者提出了一个 SReT 模型,通过循环递归结构来强化每个 block 的特征表达能力,同时又提出使用多个局部 group self-attention 来近似 vanilla global self-attention,在显著降低计算量 FLOPs 的同时,模型没有精度的损失。

本文所提出的模型在参数量(Params)和计算量(FLOPs)方面相比其他模型都有明显的优势。

推荐:ECCV 2022 | 在视觉 Transformer 上进行递归,不增参数,计算量还少。

论文 5:Generative Multiplane Images: Making a 2D GAN 3D-Aware


摘要:如何让一个已有的 2D GAN 变成 3D 级别?这是一个有趣且实用的问题。为了解决这个问题,来自苹果和伊利诺伊大学厄巴纳 - 香槟分校的研究者试图尽可能少地修改经典 GAN,即 StyleGANv2。该研究发现只有两个修改是绝对必要的:1)一个多平面图像样式生成器分支,它产生一组以深度为条件的 alpha 图;2)一个以位姿为条件的鉴别器。


推荐:仅做两项修改,苹果就让 StyleGANv2 获得了 3D 生成能力。

论文 6:Registration based Few-Shot Anomaly Detection


摘要:大多数现有的异常检测方法都专注于为每个异常检测任务训练一个专用模型。然而,在诸如缺陷检测之类的真实场景中,考虑到要处理数百种工业产品,为每种产品均收集大量训练集是不划算的。

上海交通大学 MediaBrain 团队和上海人工智能实验室智慧医疗团队等提出了一个基于配准的少样本异常检测框架,通过学习多个异常检测任务之间共享的通用模型,无需进行模型参数调整,便可将其推广到新的异常检测任务。目前,这项研究已被 ECCV2022 接收为 Oral 论文,完整训练代码及模型已经开源。

基于配准的少样本异常检测的框架。

推荐:无需微调即可推广,上交大、上海人工智能实验室等提出基于配准的少样本异常检测框架。

论文 7:Automatic Quantization for Physics-Based Simulation


摘要:在今年的 SIGGRAPH 2022 会议上,来自浙江大学、快手和美国犹他大学的研究人员联合发表了一篇题为《物理仿真的自动量化》的论文,提出了一种自动兼顾量化仿真精度和内存消耗的方法。与全精度的物理仿真相比,能够在视觉效果不受明显影响的前提下,节省 50% 以上的内存占用,从而大幅度提高了量化仿真的易用性和生产力。

目前,相关的技术已成功落地,打开快手 APP,拍摄「别哭鸭」、「我要去潜水」和「火焰超能力」等魔法表情,即可体验到短视频行业内独家的移动端实时液体模拟特效技术。

应用该方法实现的基于欧拉网格实现的量化的烟雾仿真。

推荐:节省 50% 内存占用,浙大、快手等提出量化仿真新方法,入选 SIGGRAPH 2022。

相关文章
|
16天前
|
人工智能 JSON 供应链
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
LucianaiB分享零成本畅用JVS Claw教程(学生认证享7个月使用权),并开源GeoMind项目——将JVS改造为科研与产业地理情报可视化AI助手,支持飞书文档解析、地理编码与腾讯地图可视化,助力产业关系图谱构建。
23516 12
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
|
3天前
|
Shell API 开发工具
Claude Code 快速上手指南(新手友好版)
AI编程工具卷疯啦!Claude Code凭借任务驱动+终端原生的特性,成了开发者的效率搭子。本文从安装、登录、切换国产模型到常用命令,手把手带新手快速上手,全程避坑,30分钟独立用起来。
1047 7
|
4天前
|
人工智能 BI 持续交付
Claude Code 深度适配 DeepSeek V4-Pro 实测:全场景通关与真实体验报告
在 AI 编程工具日趋主流的今天,Claude Code 凭借强大的任务执行、工具调用与工程化能力,成为开发者与自动化运维的核心效率工具。但随着原生模型账号稳定性问题频发,寻找一套兼容、稳定、能力在线的替代方案变得尤为重要。DeepSeek V4-Pro 作为新一代高性能大模型,提供了完整兼容 Claude 协议的 API 接口,只需简单配置即可无缝驱动 Claude Code,且在任务执行、工具调用、复杂流程处理上表现极为稳定。
1316 3
|
9天前
|
人工智能 缓存 Shell
Claude Code 全攻略:命令大全 + 实战工作流(完整版)
Claude Code 是一款运行在终端环境下的 AI 编码助手,能够直接在项目目录中理解代码结构、编辑文件、执行命令、执行开发计划,并支持持久化记忆、上下文压缩、后台任务、多模型切换等专业能力。对于日常开发、项目维护、快速重构、代码审查等场景,它可以大幅减少手动操作、提升编码效率。本文从常用命令、界面模式、核心指令、记忆机制、图片处理、进阶工作流等维度完整说明,帮助开发者快速上手并稳定使用。
2425 4
|
2天前
|
人工智能 JSON BI
DeepSeek V4-Pro 接入 Claude Code 完全实战:体验、测试与关键避坑指南
Claude Code 作为当前主流的 AI 编程辅助工具,凭借强大的代码理解、工程执行与自动化能力深受开发者喜爱,但原生模型的使用成本相对较高。为了在保持能力的同时进一步降低开销,不少开发者开始寻找兼容度高、价格更友好的替代模型。DeepSeek V4 系列的发布带来了新的选择,该系列包含 V4-Pro 与 V4-Flash 两款模型,并提供了与 Anthropic 完全兼容的 API 接口,理论上只需简单修改配置,即可让 Claude Code 无缝切换为 DeepSeek 引擎。
843 0
|
19天前
|
人工智能 缓存 BI
Claude Code + DeepSeek V4-Pro 真实评测:除了贵,没别的毛病
JeecgBoot AI专题研究 把 Claude Code 接入 DeepSeek V4Pro,跑完 Skills —— OA 审批、大屏、报表、部署 5 大实战场景后的真实体验 ![](https://oscimg.oschina.net/oscnet/up608d34aeb6bafc47f
5969 22
Claude Code + DeepSeek V4-Pro 真实评测:除了贵,没别的毛病
|
21天前
|
人工智能 JSON BI
DeepSeek V4 来了!超越 Claude Sonnet 4.5,赶紧对接 Claude Code 体验一把
JeecgBoot AI专题研究 把 Claude Code 接入 DeepSeek V4Pro 的真实体验与避坑记录 本文记录我将 Claude Code 对接 DeepSeek 最新模型(V4Pro)后的真实体验,测试了 Skills 自动化查询和积木报表 AI 建表两个场景——有惊喜,也踩
7197 18