AI技术让手办「整活」:3D建模居然可以这样简单

简介: AI技术让手办「整活」:3D建模居然可以这样简单

科技领域,既有用元宇宙开发布会的公司,也有 All in 元宇宙的公司,很多虚拟世界已经建立起来,人们面临的问题正在变成:真实世界中,人类创造了亿万种物品丰富着我们的生活,那么如何才能快速复制这些物品到全新的元宇宙世界中呢?

3D 内容对于元宇宙至关重要,很多科技公司正在推出用于构建虚拟世界的工具,随着计算机图形技术、元宇宙和 AI 之间的交集越来越多,这些技术也在不断升级。

最近,华为 HMS Core 3D 建模服务发布了人形角色自动建模和骨骼绑定的功能,引起了我们的注意。

看到一个可爱的手办,在想能不能拥有它的 3D 虚拟形象?只用手机围绕手办拍摄一圈,就能构建一个造型精准的 3D 模型并为其自动绑定骨骼。

在导入动作数据后,它不仅可以随你走动、向你招手,还可以完成跳舞等复杂动作。

在开放的 Demo App 中,我们只需要用普通手机摄像头围绕目标物体进行一通 360 度拍摄,清晰的 3D 模型即可生成。除了 Q 版的动漫手办以外,毛绒玩具或者机器人等人形角色也可以被扫描成模型并赋予骨骼。

那么它的能力到底如何呢?我们也实际操作了一把,我们用华为的技术给机器之心的毛绒玩偶构建了 3D 模型并绑定好骨骼。

只需使用视频中的同款动作数据驱动模型,就可以跳同款舞蹈啦:

如果四肢短小的玩偶都可以搞定的话,看起来绝大多数人形角色都是没问题的!

通过 AI 能力用 2D 照片生成 3D 模型,是人工智能学术会议中的一个热门领域,刚刚过去的国际顶会 CVPR 上就有数十篇这个方向的论文。通过对物体的不同角度进行拍摄,将 2D 图像转换为三角网格模型,生成的 3D 模型可供建筑师、设计师、艺术家和游戏开发者导入图形引擎,并可以在此基础上修改比例、更改材料或尝试不同的照明效果。而如今,前沿技术的一部分已经成为了手机上的应用,不禁让人感叹科技发展的速度。

3D 建模,手机也行

快速构建 3D 模型的能力来自华为终端云服务开放能力合集 HMS Core,其拥有 3D 建模、3D 引擎、AR Engine 等多个图形领域的开放服务。其中,3D 建模服务可以给我们带来很多想象空间,可以用在商品展示、教学、虚拟人物,甚至动画制作上。

华为 HMS Core 3D 建模服务,不需要用 TOF、深度摄像头或 LiDAR 激光雷达等特殊硬件,只需要一个普通手机的 RGB 摄像头即可完成建模。 

这个过程在使用者看来是「一键生成」的,背后经历的却是一系列复杂的处理过程。

高精度的几何重建需要先进行物体分割,将目标物与背景分离,并进行图像匹配、特征提取和深度估计,AI 算法通过分析不同角度的图像来判断位置关系,生成点云构建 3D 模型,再计算出纹理材质对模型表面进行贴图。

在这个过程中,华为利用自研的高低模技术,通过计算剔除冗余的面片,可以用更低的面片数(5 万以下)达成高面片数(10 万及以上)模型的效果,在中低端手机上也能实现精细的视觉效果。

自动生成 3D 虚拟形象的「筋骨」

为了让模型动起来,我们还需要对模型进行「骨骼绑定」:

传统流程中,骨骼绑定也需要动画师手工来完成,HMS Core 的能力大幅提升了动画制作的效率:通过自动的骨骼绑定和蒙皮权重估计,HMS Core 可以让你刚刚扫描出来的 3D 模型在导入动作数据后活动起来。

值得一提的是,在这个领域,此前少数实现自动关节估计的方法都需要目标模型摆好标准姿态。华为利用 AI 算法减少了人为规则的需求,可以支持非对称的多种姿态。

面对模型的各种姿态,AI 算法需要大量数据进行训练,但在 3D 模型重建任务上,业内其实并没有这样的数据集。

对此,华为自研了一套 3D 人形角色自动生成框架,可以基于千百个模型数据,生成数十万甚至是上百万的角色模型和骨骼。通过数据增强,HMS Core 支持了非对称姿态、不同体型和类别的人形角色的自动骨骼绑定。

投射到现实世界

最后,若想将构建好的 3D 模型呈现在真实的世界中,实现真人与 3D 虚拟物体交互的效果,还需要准确高效的 AR 能力。

华为 HMS Core 的 AR Engine 通过整合算法实现了厘米级的精准定位,开发者可以通过这些能力让虚拟世界与现实世界自然地融合在一起。



例如,AR Engine 提供了光照估计和环境 Mesh 能力,使得 3D 虚拟形象的影子会随着灯光变化,并可被现实世界中的物体挡住,带来更自然的视觉交互体验。
图形领域能力全面开放,加速元宇宙时代到来

随着业界虚实融合步伐加快,华为 HMS Core 全面开放图形领域的相关能力,助力开发者高效构建虚实融合的数字世界。 

图片来自 2022 年 7 月 HUAWEI Developer Day(简称 HDD)杭州站主论坛现场

开发者可以通过直接调用软件接口获得华为图形领域的核心能力,节省大量时间和精力,高效完成应用开发。

相信有了这种能力的加持,或许下一个爆款的 App 已在路上,元宇宙时代也将加速到来。

相关文章
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
AIGC技术深度解析:生成式AI的革命性突破与产业应用实战
蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。
|
13天前
|
机器学习/深度学习 人工智能 资源调度
嵌入式AI领域关键技术的理论基础
本内容系统讲解嵌入式AI领域关键技术的数学理论基础,涵盖神经网络量化、剪枝、知识蒸馏与架构搜索的核心原理。深入探讨量化中的信息论与优化方法、稀疏网络的数学建模、蒸馏中的信息传递机制,以及神经架构搜索的优化框架,为在资源受限环境下实现高效AI推理提供理论支撑。
52 5
|
13天前
|
存储 机器学习/深度学习 人工智能
​​解锁AI检索的7大Embedding技术:从稀疏到多向量,一文掌握!​
本文系统解析七种主流文本嵌入技术,包括 Sparse、Dense、Quantized、Binary、Matryoshka 和 Multi-Vector 方法,结合适用场景提供实用选型建议,助你高效构建文本检索系统。
128 0
|
18天前
|
人工智能 安全 数据库
AI编程:普通人难以逾越的技术高墙-优雅草卓伊凡
AI编程:普通人难以逾越的技术高墙-优雅草卓伊凡
133 15
|
19天前
|
人工智能 JSON 前端开发
Agentic AI崛起:九大核心技术定义未来人机交互模式​
本文系统梳理AI智能体架构设计的九大核心技术,涵盖智能体基础、多智能体协作、知识增强、模型优化、工具调用、协议标准化及人机交互等关键领域,助力构建高效、智能、协同的AI应用体系。建议点赞收藏,持续关注AI架构前沿技术。
322 1
|
19天前
|
数据采集 Web App开发 人工智能
如何让AI“看懂”网页?拆解 Browser-Use 的三大核心技术模块
Browser-Use 是一种基于大语言模型(LLM)的浏览器自动化技术,通过融合视觉理解、DOM解析和动作预测等模块,实现对复杂网页任务的自主操作。它突破了传统固定选择器和流程编排的限制,具备任务规划与语义理解能力,可完成注册、比价、填报等多步骤操作。其核心功能包括视觉与HTML融合解析、多标签管理、元素追踪、自定义动作、自纠错机制,并支持任意LLM模型。Browser-Use标志着浏览器自动化从“规则驱动”向“认知驱动”的跃迁,大幅降低维护成本,提升复杂任务的处理效率与适应性。
595 29
|
人工智能 安全 API
AI战略丨MCP 生态发展:从技术标准到商业机遇的全景解析
在 AI 时代,成功不再仅仅取决于技术的先进性,更取决于生态的构建能力和标准的制定权。
|
28天前
|
人工智能 自然语言处理 机器人
AI电话客服的服务质量提升路径:关键技术与典型应用场景解析
AI电话客服正从基础语音工具进化为能处理复杂业务的智能体。本文深入解析服务质量提升的关键技术路径与行业应用,涵盖语音识别、情感分析、多轮对话等核心技术,以及智能外呼、自动质检、客户数据分析等典型场景,助力零售、电商、制造、互联网等行业构建高效、有温度的智能客服体系,推动人机协同服务升级。
104 1
|
29天前
|
人工智能
AI推理方法演进:Chain-of-Thought、Tree-of-Thought与Graph-of-Thought技术对比分析
大语言模型推理能力不断提升,从早期的规模扩展转向方法创新。2022年Google提出Chain-of-Thought(CoT),通过展示推理过程显著提升模型表现。随后,Tree-of-Thought(ToT)和Graph-of-Thought(GoT)相继出现,推理结构由线性链条演进为树状分支,最终发展为支持多节点连接的图网络。CoT成本低但易错传,ToT支持多路径探索与回溯,GoT则实现非线性、多维推理,适合复杂任务。三者在计算成本与推理能力上形成递进关系,推动AI推理向更接近人类思维的方向发展。
130 4

热门文章

最新文章