阿里3D AI挑战赛落幕,2D照片10秒“升级”成3D模型

简介: 8月26日,首届阿里巴巴3D AI挑战赛落下帷幕。本届挑战赛共有1258支队伍报名参赛,三个赛道冠亚季军获奖名单出炉(文章底部查阅获奖名单),颁奖典礼将于Alibaba 3D Artificial Intelligence Challenge Workshop (IJCAI-PRICAI2020) 进行。

滚动.gif

8月26日,首届阿里巴巴3D AI挑战赛落下帷幕。本届挑战赛共有1258支队伍报名参赛,三个赛道冠亚季军获奖名单出炉(文章底部查阅获奖名单),颁奖典礼将于Alibaba 3D Artificial Intelligence Challenge Workshop (IJCAI-PRICAI2020) 进行。

同时,阿里巴巴淘系技术部开源的3D-FUTURE数据集受到了业界的广泛赞许与青睐。海内外知名院校和机构,包括斯坦福、UC伯克利、帝国理工、苏黎世理工、加利福尼亚大学、苹果、Facebook、清华、北大等,已开始就3D-FUTURE数据集开展相关学术研究。

image.png

基于阿里开源的业界首个工业级大型3D家具数据集3D-FUTURE,**“3D机器建模技术”可实现高质量高效率的3D建模,未来有望在保证工业级质量前提下,将建模时间从3小时骤降到10秒,并降低9成建模成本。
**
image.png

阿里开源的3D家具数据集3D-FUTURE中的家具示意图

3D模型是未来数字化与智能化的基础,但3D建模成本高、效率低,设计师通常需1~3小时才能完成单个物体的手工建模。本次大赛旨在利用3D AI技术破解产业难题,共吸引1258支队伍参加,选手们在阿里开源的3D-FUTURE数据集基础上,通过深度学习技术,让AI在10秒内完成3D建模。

大赛其中一条赛道“基于单张图的3D模型重建”,需参赛队伍对2D照片中的家具进行3D重建,是设计师常见工作之一。来自Zhongjun Wu等人提出的新方法,能根据照片迅速给出3D建模结果,与设计师人工建模匹配度最高,并以79.01分的成绩夺冠。通常重建一个3D模型成本在300~500元,通过3D AI技术,可迅速批量重建3D模型,业内估计将降低9成建模成本。

image.png

图为3D建模对比图,分别为输入图片,设计师模型,机器重建模型

阿里巴巴淘系技术资深算法专家 乐田表示:“3D重建是3D机器学习的核心,只有在高质量3D数据集支持下,工业级3D AI建模才能满足更大规模的产业需求,技术前景广阔。”阿里3D AI技术已成功应用在淘宝3D购、躺平设计家等场景中,未来还可应用于自动驾驶、VR、AR等领域,将大大提高人机互动、线上商城、室内设计等场景的精确度和丰富度。

image.png

三维重建是目前的研究核心与趋势,也是打造未来数字化世界的基础。然而,高精度三维重建还停留在研究初期阶段,尤其在家居行业的工业落地困难重重。阿里作为互联网领军者之一,期望为3D家居高精度重建,叩响工业界的大门,开启智能家居设计的崭新时代,为未来的家居设计提供更加便捷,高效的解决方案,以革新家居生活新体验。

此次竞赛总结了业界最先进的高校建模方案,探索并驱动了3D重建工业界建模的方法研究。AI技术将会百倍级压缩建模时间,大大简化家居设计时间,为未来降低工业设计成本,提高客户体验感提供新方向。在数据为王的时代,业界此前并没有高质量3D家居开源数据集,这极大制约了学术及工业界在3D高精度重建方面的研究发展。此次,阿里巴巴淘系技术部开源了3D-FUTURE数据集,共包含20,000+高清室内场景专业设计渲染图,与10,000+工业在用的高精度3D家具模型,以及信息丰富的高清纹理和属性标签,让数据驱动的工业级3D建模成为可能。该数据集拥有少见的高清纹理,几何细节丰富的模型、以及丰富的类别属性。一经发布,就吸引了斯坦福大学、加州大学伯克利分校、清华大学、香港中文大学等高校及苹果、Facebook等企业,在该数据集基础上开展学术和应用的前沿研究。我们将持续维护,完善,提升,并扩充该数据集。

3D-FUTURE数据集主页:
https://tianchi.aliyun.com/specials/promotion/alibaba-3d-future

2020阿里巴巴 3D AI 挑战赛获奖名单如下:

// 赛道一 reconstruction
image.png

// 赛道二 retrieval
image.png

// 赛道三 segmentation
image.png

关注「淘系技术」微信公众号,一个有温度有内容的技术社区~
image.png

相关文章
|
3天前
|
人工智能 开发框架 算法
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
Qwen-Agent 是阿里通义开源的一个基于 Qwen 模型的 Agent 应用开发框架,支持指令遵循、工具使用、规划和记忆能力,适用于构建复杂的智能代理应用。
58 10
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
|
13天前
|
人工智能
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
AniDoc 是一款基于视频扩散模型的 2D 动画上色 AI 模型,能够自动将草图序列转换为彩色动画。该模型通过对应匹配技术和背景增强策略,实现了色彩和风格的准确传递,适用于动画制作、游戏开发和数字艺术创作等多个领域。
83 16
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
|
29天前
|
人工智能 自然语言处理 前端开发
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
Lobe Vidol是一款开源的AI数字人交互平台,允许用户创建和互动自己的虚拟偶像。该平台提供流畅的对话体验、丰富的动作姿势库、优雅的用户界面设计以及多种技术支持,如文本到语音和语音到文本技术。Lobe Vidol适用于娱乐互动、在线教育、客户服务、品牌营销和社交媒体等多个应用场景。
100 7
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
|
29天前
|
人工智能 vr&ar
GeneMAN:上海AI Lab联合北大等高校推出的3D人体模型创建框架
GeneMAN是由上海AI实验室、北京大学、南洋理工大学和上海交通大学联合推出的3D人体模型创建框架。该框架能够从单张图片中生成高保真度的3D人体模型,适用于多种应用场景,如虚拟试衣、游戏和娱乐、增强现实和虚拟现实等。
56 7
GeneMAN:上海AI Lab联合北大等高校推出的3D人体模型创建框架
|
3月前
|
消息中间件 人工智能 Cloud Native
|
3月前
|
人工智能 编解码 文字识别
阿里国际AI开源Ovis1.6,多项得分超GPT-4o-mini!
阿里国际AI团队提出了一种名为Ovis (Open VISion)的新型多模态大模型的架构。
|
3月前
|
人工智能 Ubuntu Linux
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
|
4月前
|
人工智能 前端开发 Java
Spring Cloud Alibaba AI,阿里AI这不得玩一下
🏀闪亮主角: 大家好,我是JavaDog程序狗。今天分享Spring Cloud Alibaba AI,基于Spring AI并提供阿里云通义大模型的Java AI应用。本狗用SpringBoot+uniapp+uview2对接Spring Cloud Alibaba AI,带你打造聊天小AI。 📘故事背景: 🎁获取源码: 关注公众号“JavaDog程序狗”,发送“alibaba-ai”即可获取源码。 🎯主要目标:
126 0
|
4月前
|
消息中间件 人工智能 运维
|
6天前
|
机器学习/深度学习 人工智能 自动驾驶
企业内训|AI大模型在汽车行业的前沿应用研修-某汽车集团
本课程是TsingtaoAI为某汽车集团高级项目经理设计研发,课程全面系统地解析AI的发展历程、技术基础及其在汽车行业的深度应用。通过深入浅出的理论讲解、丰富的行业案例分析以及实战项目训练,学员将全面掌握机器学习、深度学习、NLP与CV等核心技术,了解自动驾驶、智能制造、车联网与智能营销等关键应用场景,洞悉AI技术对企业战略布局的深远影响。
135 97