AI 顶会 NeurIPS 收录:淘系技术自研3D AI 算法

简介: 阿里巴巴淘系技术研发了全新 3D AI 算法,可基于 2D 图片精准搜索出相应的 3D 模型,准确率大幅提升10%,可降低 3D 打印、VR 看房、场景导购等领域的门槛。该研究成果已被 AI 顶会 NeurIPS 2020 收录。

原创 淘系技术 淘系技术  2020-12-10


导读:阿里巴巴淘系技术研发了全新 3D AI 算法,可基于 2D 图片精准搜索出相应的 3D 模型,准确率大幅提升10%,可降低 3D 打印、VR 看房、场景导购等领域的门槛。该研究成果已被 AI 顶会 NeurIPS 2020 收录。


image.png


3D研究是目前业界最热门的课题之一,是打造3D智能世界的核心基础。在探索3D数字化家居建设的过程中,阿里巴巴淘系技术部最新提出的2D图搜3D模型(IBSR)方案受到学界认可,相关论文已被国际人工智能顶会NeurIPS 2020录用发表。


image.png


IBSR旨在根据2D图片从给定3D池子里搜索出图片里物体对应的CAD模型。随着3D CAD模型数量迅速增长,研究设计高精度IBSR系统意义重大。 其有利于快速还原真实三维场景,也在数据库驱动的3D模型重建问题中扮演着至关重要的角色。解决IBSR问题的通用思路是将2D图与3D模型映射到同一空间,并学习相似度度量函数。过去几年,包括卡耐基梅隆大学,麻省理工,斯坦福大学等顶级学府都纷纷建立IBSR基准数据集,并投入相关研究。

 


动机


image.png


IBSR最大的难点在于如何克服2D图与3D模型的appearance gap,并解耦出无纹理信息干扰的统一几何表面特征表达。我们发现IBSR问题有一些特别的性质,包括(1)3D模型通常都是独立的个体(类别);(2)同一个3D模型现实中可能会对应不同纹理表面。这些特性在过去都未被很好的建模学习,使得传统方法在精细3D模型推荐上表现不尽如人意。

 


方法概述


image.png


针对这些特性,阿里巴巴淘系技术提出了纹理合成驱动的多视角度量学习架构。具体来说,我们设计纹理生成的条件对抗生成网络 (cGAN) 来为度量学习创造困难三元组 (Hard Triplets),使网络在训练过程中能有效抑制2D图丰富纹理的不利干扰,从而更关注于物体的几何细节特点。同时,为了使网络学习几何表面特征更容易,我们利用显著性与视角注意力机制来尽可能消除2D图片杂乱背景与无约束的投影视角干扰。

 


实验结果


image.png


我们的方案在多个开源数据集,包括Pix3D,Stanford Cars,Comp Cars,和3D-FUTURE,都取得了SOTA的结果,并且3D模型搜索准确率超过传统方法约10%以上。其中,3D-FUTURE为阿里巴巴淘系技术部主导开源的业界首个饱含纹理细节的大型3D家具模型数据集,欢迎大家使用并提取建议。

 

3D-FUTURE数据集链接:https://tianchi.aliyun.com/specials/promotion/alibaba-3d-future

相关文章
|
10天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
12月14日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
|
3天前
|
机器学习/深度学习 人工智能 算法
Enhance-A-Video:上海 AI Lab 推出视频生成质量增强算法,显著提升 AI 视频生成的真实度和细节表现
Enhance-A-Video 是由上海人工智能实验室、新加坡国立大学和德克萨斯大学奥斯汀分校联合推出的视频生成质量增强算法,能够显著提升视频的对比度、清晰度和细节真实性。
24 8
Enhance-A-Video:上海 AI Lab 推出视频生成质量增强算法,显著提升 AI 视频生成的真实度和细节表现
|
2天前
|
数据采集 人工智能 运维
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
本文介绍了阿里云 Elasticsearch 推出的创新型 AI 搜索方案
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
|
14天前
|
人工智能 安全 算法
深度剖析 打造大模型时代的可信AI:技术创新与安全治理并重
2024年12月11日,由中国计算机学会计算机视觉专委会主办的“打造大模型时代的可信AI”论坛在上海举行。论坛汇聚了来自多家知名学术机构和企业的顶尖专家,围绕AI的技术风险与治理挑战,探讨如何在大模型时代确保AI的安全性和可信度,推动技术创新与安全治理并行。论坛重点关注计算机视觉领域的最新进展,提出了多项技术手段和治理框架,为AI的健康发展提供了有力支持。
58 8
深度剖析 打造大模型时代的可信AI:技术创新与安全治理并重
|
14天前
|
机器学习/深度学习 人工智能 运维
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
阿里云技术公开课预告:Elastic和阿里云搜索技术专家将深入解读阿里云Elasticsearch Enterprise版的AI功能及其在实际应用。
110 2
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
|
14天前
|
机器学习/深度学习 传感器 人工智能
AI视频监控系统在养老院中的技术实现
AI视频监控系统在养老院的应用,结合了计算机视觉、深度学习和传感器融合技术,实现了对老人体征、摔倒和异常行为的实时监控与分析。系统通过高清摄像头和算法模型,能够准确识别老人的动作和健康状况,并及时向护理人员发出警报,提高护理质量和安全性。
82 14
|
6天前
|
人工智能 分布式计算 供应链
高效提取图片信息:AI技术赋能企业数字化转型
本文介绍了如何通过AI技术高效提取图片中的结构化信息,提升企业运营效率。具体应用场景包括票据与合同管理、电商商品信息管理、保险理赔和物流单据处理等。AI技术能将传统人工录入流程缩短至秒级,准确率高达99%,减少人为错误,提升客户满意度。方案优势在于易于扩展、灵活高性价比的调用模式及便捷安全的云产品接入。文中还详细描述了部署应用、访问示例应用及使用官方示例进行信息提取的操作步骤,并提供了参考链接和源码下载途径。
|
6天前
|
机器学习/深度学习 传感器 人工智能
开源AI视频监控系统在监狱安全中的应用——实时情绪与行为分析、暴力预警技术详解
针对监狱环境中囚犯情绪波动和复杂人际互动带来的监控挑战,传统CCTV系统难以有效预警暴力事件。AI视频监控系统基于深度学习与计算机视觉技术,实现对行为、情绪的实时分析,尤其在低光环境下表现优异。该系统通过多设备协同、数据同步及自适应训练,确保高精度识别(95%以上)、快速响应(<5秒),并具备24小时不间断运行能力,极大提升了监狱安全管理的效率与准确性。
|
13天前
|
存储 人工智能 运维
AI-Native的路要怎么走?一群技术“老炮儿”指明了方向
上世纪70年代,沃兹尼亚克、乔布斯等人成立Homebrew Computer Club,推动个人电脑普及。如今,创原会承袭这一精神,由CNCF执行董事Priyanka Sharma等构建,聚焦云原生和AI技术,汇聚各行业技术骨干,探索前沿科技。2024年创原会年度峰会达成“全面拥抱AI-Native”共识,解决算力与存储瓶颈,推动AI原生应用开发,助力千行万业智能化转型,成为行业创新风向标。
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
师资研修|AI技术赋能教材建设和课程开发——乌鲁木齐某教育部门
近日,TsingtaoAI派出AI专家为乌鲁木齐中职院校的教师团队,举办“AI技术赋能教材建设与课程开发”的师资研修。此次培训由TsingtaoAI的AI专家高寒和教育专家刘建老师亲自授课,面对的是来自乌鲁木齐的教育工作者,特别是中职院校的教学骨干。整个活动不仅涉及人工智能技术本身的深度解析,还深入探讨了如何将这些前沿技术高效应用于教材和课程体系的创新。
28 0