AI 顶会 NeurIPS 收录:淘系技术自研3D AI 算法

简介: 阿里巴巴淘系技术研发了全新 3D AI 算法,可基于 2D 图片精准搜索出相应的 3D 模型,准确率大幅提升10%,可降低 3D 打印、VR 看房、场景导购等领域的门槛。该研究成果已被 AI 顶会 NeurIPS 2020 收录。

原创 淘系技术 淘系技术  2020-12-10


导读:阿里巴巴淘系技术研发了全新 3D AI 算法,可基于 2D 图片精准搜索出相应的 3D 模型,准确率大幅提升10%,可降低 3D 打印、VR 看房、场景导购等领域的门槛。该研究成果已被 AI 顶会 NeurIPS 2020 收录。


image.png


3D研究是目前业界最热门的课题之一,是打造3D智能世界的核心基础。在探索3D数字化家居建设的过程中,阿里巴巴淘系技术部最新提出的2D图搜3D模型(IBSR)方案受到学界认可,相关论文已被国际人工智能顶会NeurIPS 2020录用发表。


image.png


IBSR旨在根据2D图片从给定3D池子里搜索出图片里物体对应的CAD模型。随着3D CAD模型数量迅速增长,研究设计高精度IBSR系统意义重大。 其有利于快速还原真实三维场景,也在数据库驱动的3D模型重建问题中扮演着至关重要的角色。解决IBSR问题的通用思路是将2D图与3D模型映射到同一空间,并学习相似度度量函数。过去几年,包括卡耐基梅隆大学,麻省理工,斯坦福大学等顶级学府都纷纷建立IBSR基准数据集,并投入相关研究。

 


动机


image.png


IBSR最大的难点在于如何克服2D图与3D模型的appearance gap,并解耦出无纹理信息干扰的统一几何表面特征表达。我们发现IBSR问题有一些特别的性质,包括(1)3D模型通常都是独立的个体(类别);(2)同一个3D模型现实中可能会对应不同纹理表面。这些特性在过去都未被很好的建模学习,使得传统方法在精细3D模型推荐上表现不尽如人意。

 


方法概述


image.png


针对这些特性,阿里巴巴淘系技术提出了纹理合成驱动的多视角度量学习架构。具体来说,我们设计纹理生成的条件对抗生成网络 (cGAN) 来为度量学习创造困难三元组 (Hard Triplets),使网络在训练过程中能有效抑制2D图丰富纹理的不利干扰,从而更关注于物体的几何细节特点。同时,为了使网络学习几何表面特征更容易,我们利用显著性与视角注意力机制来尽可能消除2D图片杂乱背景与无约束的投影视角干扰。

 


实验结果


image.png


我们的方案在多个开源数据集,包括Pix3D,Stanford Cars,Comp Cars,和3D-FUTURE,都取得了SOTA的结果,并且3D模型搜索准确率超过传统方法约10%以上。其中,3D-FUTURE为阿里巴巴淘系技术部主导开源的业界首个饱含纹理细节的大型3D家具模型数据集,欢迎大家使用并提取建议。

 

3D-FUTURE数据集链接:https://tianchi.aliyun.com/specials/promotion/alibaba-3d-future

相关文章
|
机器学习/深度学习 人工智能 PyTorch
模型手动绑骨3天,AI花3分钟搞定!UniRig:清华开源通用骨骼自动绑定框架,助力3D动画制作
UniRig是清华大学与VAST联合研发的自动骨骼绑定框架,基于自回归模型与交叉注意力机制,支持多样化3D模型的骨骼生成与蒙皮权重预测,其创新的骨骼树标记化技术显著提升动画制作效率。
2236 27
模型手动绑骨3天,AI花3分钟搞定!UniRig:清华开源通用骨骼自动绑定框架,助力3D动画制作
|
人工智能 运维 算法
基于 C# 深度优先搜索算法的局域网集中管理软件技术剖析
现代化办公环境中,局域网集中管理软件是保障企业网络高效运行、实现资源合理分配以及强化信息安全管控的核心工具。此类软件需应对复杂的网络拓扑结构、海量的设备信息及多样化的用户操作,而数据结构与算法正是支撑其强大功能的基石。本文将深入剖析深度优先搜索(Depth-First Search,DFS)算法,并结合 C# 语言特性,详细阐述其在局域网集中管理软件中的应用与实现。
272 3
|
机器学习/深度学习 人工智能 JSON
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。
1696 19
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
|
10月前
|
监控 算法 安全
基于 C# 基数树算法的网络屏幕监控敏感词检测技术研究
随着数字化办公和网络交互迅猛发展,网络屏幕监控成为信息安全的关键。基数树(Trie Tree)凭借高效的字符串处理能力,在敏感词检测中表现出色。结合C#语言,可构建高时效、高准确率的敏感词识别模块,提升网络安全防护能力。
252 2
|
9月前
|
运维 监控 算法
基于 Java 滑动窗口算法的局域网内部监控软件流量异常检测技术研究
本文探讨了滑动窗口算法在局域网流量监控中的应用,分析其在实时性、资源控制和多维分析等方面的优势,并提出优化策略,结合Java编程实现高效流量异常检测。
368 0
|
12月前
|
监控 算法 JavaScript
基于 JavaScript 图算法的局域网网络访问控制模型构建及局域网禁止上网软件的技术实现路径研究
本文探讨局域网网络访问控制软件的技术框架,将其核心功能映射为图论模型,通过节点与边表示终端设备及访问关系。以JavaScript实现DFS算法,模拟访问权限判断,优化动态策略更新与多层级访问控制。结合流量监控数据,提升网络安全响应能力,为企业自主研发提供理论支持,推动智能化演进,助力数字化管理。
298 4
|
12月前
|
存储 监控 算法
内网监控桌面与 PHP 哈希算法:从数据追踪到行为审计的技术解析
本文探讨了内网监控桌面系统的技术需求与数据结构选型,重点分析了哈希算法在企业内网安全管理中的应用。通过PHP语言实现的SHA-256算法,可有效支持软件准入控制、数据传输审计及操作日志存证等功能。文章还介绍了性能优化策略(如分块哈希计算和并行处理)与安全增强措施(如盐值强化和动态更新),并展望了哈希算法在图像处理、网络流量分析等领域的扩展应用。最终强调了构建完整内网安全闭环的重要性,为企业数字资产保护提供技术支撑。
318 2
|
存储 监控 算法
基于 Python 哈希表算法的局域网网络监控工具:实现高效数据管理的核心技术
在当下数字化办公的环境中,局域网网络监控工具已成为保障企业网络安全、确保其高效运行的核心手段。此类工具通过对网络数据的收集、分析与管理,赋予企业实时洞察网络活动的能力。而在其运行机制背后,数据结构与算法发挥着关键作用。本文聚焦于 PHP 语言中的哈希表算法,深入探究其在局域网网络监控工具中的应用方式及所具备的优势。
356 7