社区供稿 | 3D物生成,帮你轻松造万物

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 最近魔搭上线了一项新能力——用手机环拍物体1min视频即可生成3D模型

导读

 

最近魔搭上线了一项新能力——用手机环拍物体1min视频即可生成3D模型,该过程完全自动化且一小时左右即可构建完成!它不仅解救了传统行业手工建模的设计师们,也让芸芸众生的我们变身上古女娲,想在数字世界里生成什么,拿起手机即可生成,让我们来看看下面的效果:

https://live.csdn.net/v/324733

通过手机环拍构建出来的物体模型及贴图很完整自然,该服务当前已魔搭创空间上线并开放免费使用,操作简单,快来跟着小编一起试试吧!

 

使用指引

 

1、注册并登陆魔搭平台

进入ModelScope官网:https://modelscope.cn/home,点击右上角“登陆/注册”,进入注册页面,并填写注册所需信息完成注册。建议用手机号注册,速度最快。

 

2、访问3D物生成的创空间页面

账号登陆后进入创空间页面 https://modelscope.cn/studios/Damo_XR_Lab/3D_AIGC/summary

 

3、(简易体验版)选择页面下方的示例输入,即可在快速生成模型结果

 

 

4、(充分体验版)制作你元宇宙世界里的万物

仅需三步即可完成:

 

 

4.1 根据拍摄指引拍摄物体视频

https://live.csdn.net/v/324735

 

4.2 选择并上传您的视频

点击上图步骤中“选择视频”按钮,选择拍摄完成的视频进行上传。

温馨提示:由于视频文件较大,上传需一些时间,建议上传完成前保持页面,上传完成后再关闭。

 

 

4.3 等待构建完成即可查看您的3D模型结果

上传完成后再视频框中即可出现您的原视频结果,可输入您的邮箱地址,我们将会在构建完成后进行邮件通知。

 

 

除了视频构建3D物体模型以外,未来我们还会上线图片生成以及文本生成,让用户可以尽情发挥想象力去创造未来3D世界!

 

5、(充分体验版)无限制构建你的3D物模型

如果你想保存所有扫描后的3D物体模型,可下载app进行充分体验更高精度的建模:

 

 

技术探秘

 

XR实验室长期探索3D内容生成,在此分享我们结合大模型的能力推进3D物生成的技术链路及思考,未来相应的生成模型都会通过ModelScope平台开放。

 

1、3D物生成框架:

用户输入一段视频、图片或者文本,可以生成相应的3D内容。

具体来说,我们可提供的能力大致分为:

 

  • 视频转3D:通过输入一段拍摄物体的几十秒视频,AI在一个小时内生成具有纹理的3D模型
  • 图像转3D:通过输入单张或者几张2D图像,AI自动将其转换为3D模型
  • 文本转3D:通过文本输入,AI自动生成3D模型
  • AI 3D纹理:给定几何模型和文本提示,AI自动为模型进行纹理贴图

 

首先来分享下视频转3D的技术实现链路:

 

 

整个方案主要包含五大模块,分别是:检测和分割、神经重建、纹理贴图、模型简化、纹理烘焙。

 

下面重点介绍检测和分割、隐式神经重建两大模块。

 

  • 检测和分割

目标是在视频帧中将物体从背景中分割出来,便于后续的处理。我们采用了基于图像分割大模型Segment Anything Model(SAM)[1]的视频跟踪方案。该方案要求在第一帧上能将物体自动分割出来,为此我们采用基于显著性目标检测的模块,它能够自动地检测出物体大致的Mask。借助SAM模型提供的:根据输入的提示比如鼠标选点、画框来获取分割区域的能力,我们将检测得到的Mask转换成选点,再经过SAM模型处理就得到物体精细的Mask。

 

  • 神经重建

为了能够根据输入的多视角图片以及相应的相机位姿,重建出物体的几何,我们采用了神经隐式表面重建的方案。

 

神经重建的方案比如NeuS[2]、VolSDF[3],通过结合基于可微分的体渲染技术和符号距离场,可以高保真地恢复出物体几何,但是耗时比较长,通常一个物体的几何重建长达十小时。为了提高重建的效率和精度,我们采用自研的HIVE[4]方案,参考Instant-NGP[5],Plenoxels[6]等加速新视角合成的NeRF[7]方案,设计层次结构的体素方案来加速收敛和提升精度, 目前几何重建的时间最快能压缩到二十分钟。

 

除了视频生成方向,我们也在研发图像/文本转3D、AI 3D纹理技术。

 

  • 图像/文本转3D的技术

目前大致有两类生成的方案,第一类是采用优化迭代的方案,得益于多模态领域和文生图模型的发展,通过文本或者图片的输入,可以直接输出高质量的3D模型,但是耗时较长。另外一类方案,采用3D数据来训练3D Diffusion模型,只需要单次前向预测,可以快速得到结果,但是效果受限于3D数据量。我们正在针对两类方案做一些优化改进,一是设计更加合理的3D表征结构,可以输出高质量的模型,二是利用2D图像的Depth、Normal等信息,提供更多的约束。

 

  • AI 3D纹理的技术

给定几何,根据文本提示词,可以自动给模型贴上纹理。我们目前正在基于Stable Diffusion的能力,生成多视角更加一致的图片,同时加入融合优化的策略,进一步提升质量。

提示词:"a white audi Q5 car, plain background"

结果:

 

 

 

引用

 

[1] SAM: Kirillov A, Mintun E, Ravi N, et al. Segment anything

[2] NeuS: Wang P, Liu L, Liu Y, et al. Neus: Learning neural implicit surfaces by volume rendering for multi-view reconstruction

[3] VolSDF: Yariv L, Gu J, Kasten Y, et al. Volume rendering of neural implicit surfaces

[4] HIVE: Gu X, Yuan W, et al. Hierarchical volume encoding for neural implicit surface reconstruction

[5] Instant-NGP: Müller T, Evans A, Schied C, et al. Instant neural graphics primitives with a multiresolution hash encoding

[6] Plenoxels: Fridovich-Keil S, Yu A, Tancik M, et al. Plenoxels: Radiance fields without neural networks

[7] NeRF: Mildenhall B, Srinivasan P P, Tancik M, et al. Nerf: Representing scenes as neural radiance fields for view synthesis

 

试用3D物生成服务

https://modelscope.cn/studios/Damo_XR_Lab/3D_AIGC/summary

相关文章
|
机器学习/深度学习 人工智能 编解码
课时1;跨越N次元 一键变身AI漫画人
课时1;跨越N次元 一键变身AI漫画人
|
7月前
|
机器学习/深度学习 vr&ar 图形学
3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式
【6月更文挑战第9天】中科院自动化所和北邮团队合作开发的MaterialSeg3D框架,革新了3D资产材质生成。该框架利用2D图像语义先验推断3D材质,解决了现有方法因光照和阴影导致的材质虚假关联问题。研究团队构建了MIO材质数据集以支持语义先验学习,并通过多视角渲染、材质预测和材质UV生成三步流程实现精确3D材质生成。尽管面临光照效果和输入网格质量的挑战,MaterialSeg3D在材质分割和生成上表现优秀,有望提升3D资产质量,其相关论文可在arXiv上查阅。
71 6
|
6月前
|
数据采集 人工智能 数据可视化
“会数据同学”首站走进雅戈尔,看老牌男装品牌如何用“数据+AI”华丽转身
“会数据同学”首站走进雅戈尔,看老牌男装品牌如何用“数据+AI”华丽转身
154 0
|
8月前
|
人工智能 搜索推荐 开发者
社区供稿 | 大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品
北大团队新作,让大模型拥有个性!而且还是自定义那种,16种MBTI都能选。
|
算法 程序员 编译器
C生万物 | 函数的讲解与剖析【内附众多案例详解】
全面了解C语言中函数的内容,带你从浅至深学会函数的使用
116540 5
C生万物 | 函数的讲解与剖析【内附众多案例详解】
|
人工智能
我们只是好奇:各家大模型高考作文写的怎么样?
我们只是好奇:各家大模型高考作文写的怎么样?
|
机器学习/深度学习 数据采集 人工智能
AI十级「找茬」选手,非这个书生莫属,节后开源!(1)
AI十级「找茬」选手,非这个书生莫属,节后开源!
157 0
|
机器学习/深度学习 人工智能 Rust
2021 年 Rust 生态版图调研报告 | 星辰大海(下篇)
2021 年 Rust 生态版图调研报告 | 星辰大海(下篇)
935 0
|
存储 编解码 安全
99行代码实现冰雪奇缘特效的「太极」再进化,胡渊鸣团队、快手等联合打造
99 行代码实现《冰雪奇缘》特效的续集来了,太极编译器再次升级。
263 0
99行代码实现冰雪奇缘特效的「太极」再进化,胡渊鸣团队、快手等联合打造
|
机器学习/深度学习 人工智能 自动驾驶
公开下载 | 让刷剧更带感!“划时代”文娱体验背后有何技术较量?
AI弹幕、VR技术、5G超清......这在十年前可能都只是停留在人们想象中的文娱新体验,如今已经普及开来。如何让刷剧更“带感”?阿里巴巴文娱有答案!刷剧前下载,刷剧后阅读,8位阿里技术专家为你详解那些你不知道的智慧文娱关键技术!
18155 0
公开下载 | 让刷剧更带感!“划时代”文娱体验背后有何技术较量?

热门文章

最新文章