DeepMesh:3D建模革命!清华团队让AI自动优化拓扑,1秒生成工业级网格

本文涉及的产品
视觉智能开放平台,视频通用资源包5000点
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,图像通用资源包5000点
简介: DeepMesh 是由清华大学和南洋理工大学联合开发的 3D 网格生成框架,基于强化学习和自回归变换器,能够生成高质量的 3D 网格,适用于虚拟环境构建、动态内容生成、角色动画等多种场景。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🖨️ 「ZBrush要过时?清华核弹框架把3D建模变『填空题』」

大家好,我是蚝油菜花。你是否也经历过这些建模地狱——

  • 👉 为调拓扑通宵改7版,甲方却说"还是第一版好看"
  • 👉 点云数据像散沙,手动补面补到视网膜脱落
  • 👉 渲染时发现隐藏面穿模,一夜回到解放前...

今天要炸场的 DeepMesh 正在重构3D工作流!这个学术派AI建模神器:

  • 强化学习造面术:DPO算法让每个三角面都长在人类审美点上
  • 点云秒变精模:稀疏扫描数据直接生成ISO标准工业网格
  • 动态拓扑黑科技:自回归变换器实时修正模型,穿模成为历史

已有游戏团队用它3小时做完角色建模,工业设计公司靠它批量处理扫描数据——你的鼠标,是时候从面片地狱中解放了!

🚀 快速阅读

DeepMesh 是一个基于强化学习和自回归变换器的 3D 网格生成框架。

  1. 核心功能:支持高质量 3D 网格生成、点云条件生成和图像条件生成。
  2. 技术原理:采用自回归变换器、高效预训练策略和强化学习优化,确保生成的网格既精确又符合人类审美。

DeepMesh 是什么

DeepMesh

DeepMesh 是由清华大学和南洋理工大学的研究人员提出的 3D 网格生成框架。它基于强化学习和自回归变换器,能够生成高质量的 3D 网格。通过两项关键创新,DeepMesh 在网格生成的质量和效率上实现了显著提升。

首先,DeepMesh 引入了高效的预训练策略,结合了新型标记化算法和改进的数据处理流程,显著缩短了序列长度,同时保留了几何细节。其次,DeepMesh 采用了直接偏好优化(DPO)的强化学习方法,使生成的网格在几何精度和视觉效果上更符合人类偏好。

DeepMesh 的主要功能

  • 高质量 3D 网格生成:DeepMesh 能生成具有丰富细节和精确拓扑结构的 3D 网格,适用于各种复杂的几何形状。
  • 点云条件生成:DeepMesh 可以根据输入的点云数据生成对应的 3D 网格,适用于从稀疏点云到密集点云的各种场景。
  • 图像条件生成:DeepMesh 支持基于图像的条件生成,能根据输入的 2D 图像生成 3D 网格。

DeepMesh 的技术原理

  • 自回归变换器:DeepMesh 采用自回归变换器作为核心架构,包含自注意力层和交叉注意力层,逐步生成网格的面,通过条件输入(如点云或图像)来预测网格的顶点和面。
  • 高效预训练策略:DeepMesh 引入了一种改进的标记化算法,通过局部感知的面遍历和块索引坐标编码,显著缩短了序列长度,同时保留了几何细节。
  • 强化学习与人类偏好对齐:DeepMesh 引入了直接偏好优化(DPO),通过人工评估和 3D 指标设计评分标准,收集偏好对用于强化学习训练,使生成的网格在几何精度上准确,在视觉效果上更符合人类审美。
  • 端到端可微分的网格表示:DeepMesh 支持端到端可微分的网格表示,拓扑可以动态变化,这种可微分性使模型能通过梯度下降进行优化,进一步提升生成网格的质量。

如何运行 DeepMesh

1. 安装

我们的环境已在 Ubuntu 22、CUDA 11.8 上测试,支持 A100、A800 和 A6000 显卡。

克隆仓库并创建 conda 环境:

git clone https://github.com/zhaorw02/DeepMesh.git && cd DeepMesh
conda env create -f environment.yaml
conda activate deepmesh

安装预训练模型权重:

pip install -U "huggingface_hub[cli]"
huggingface-cli login
huggingface-cli download zzzrw/DeepMesh --local-dir ./

2. 使用

命令行推理

# 生成文件夹中的所有 obj/ply 文件
CUDA_VISIBLE_DEVICES=0 torchrun --nproc-per-node=1 --master-port=12345 sample.py \
    --model_path "your_model_path" \
    --steps 90000 \
    --input_path examples \
    --output_path mesh_output \
    --repeat_num 4 \
    --temperature 0.5 \

# 生成指定的 obj/ply 文件
CUDA_VISIBLE_DEVICES=0 torchrun --nproc-per-node=1 --master-port=22345.py \
    --model_path "your_model_path" \
    --steps 90000 \
    --input_path examples \
    --output_path mesh_output \
    --repeat_num 4 \
    --uid_list "wand1.obj,wand2.obj,wand3.ply" \
    --temperature 0.5 \

# 或者使用脚本
bash sample.sh

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
8天前
|
机器学习/深度学习 人工智能 PyTorch
模型手动绑骨3天,AI花3分钟搞定!UniRig:清华开源通用骨骼自动绑定框架,助力3D动画制作
UniRig是清华大学与VAST联合研发的自动骨骼绑定框架,基于自回归模型与交叉注意力机制,支持多样化3D模型的骨骼生成与蒙皮权重预测,其创新的骨骼树标记化技术显著提升动画制作效率。
168 27
模型手动绑骨3天,AI花3分钟搞定!UniRig:清华开源通用骨骼自动绑定框架,助力3D动画制作
|
11天前
|
机器学习/深度学习 人工智能 自然语言处理
如何利用AI简历优化工具提升招聘效率?HR必读指南
本文为HR提供如何利用AI简历优化工具提升招聘效率的实用指南。针对海量简历筛选难题,AI工具通过自然语言处理技术实现信息提取与智能分析,大幅提高筛选效率和精准度。文章解析了工具在数据驱动决策、多语言支持及动态评估模型上的优势,并提出科学应用框架,如岗位画像量化、分阶段筛选策略等。同时探讨未来智能化招聘趋势,强调人机协同的重要性,助力HR将精力转向更具创造性的工作,推动人力资源管理体系全面升级。
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
SurveyGO是清华与面壁智能联合开源的AI论文写作工具,采用LLMxMapReduce-V2技术实现文献智能聚合,能根据用户输入主题快速生成结构严谨、引用可靠的学术综述。
54 1
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
|
22天前
|
机器学习/深度学习 人工智能 JSON
OPPO联合港科大推出多模态推理优化框架 OThink-MR1:让AI学会『举一反三』,几何推理准确率暴增
OThink-MR1是OPPO与港科大联合研发的多模态优化框架,通过动态KL散度策略和奖励模型显著提升模型在视觉计数等复杂任务中的泛化能力。
81 20
OPPO联合港科大推出多模态推理优化框架 OThink-MR1:让AI学会『举一反三』,几何推理准确率暴增
|
1月前
|
人工智能 搜索推荐 物联网
InfiniteYou:写真AI革命!字节核弹级AI秒出定制人像,身份保持度拉满
InfiniteYou 是字节跳动推出的基于扩散变换器的身份保持图像生成框架,通过 InfuseNet 注入身份特征,结合多阶段训练策略,生成高质量、高相似度的图像,兼容多种现有工具,适用于多种应用场景。
372 29
InfiniteYou:写真AI革命!字节核弹级AI秒出定制人像,身份保持度拉满
|
20天前
|
机器学习/深度学习 数据采集 人工智能
清华联合DeepSeek推出奖励模型新标杆!DeepSeek-GRM:让AI学会自我批评,推理性能越跑越强
DeepSeek-GRM是由DeepSeek与清华大学联合研发的通用奖励模型,采用点式生成式奖励建模和自我原则点评调优技术,显著提升了模型质量和推理扩展性。
153 13
清华联合DeepSeek推出奖励模型新标杆!DeepSeek-GRM:让AI学会自我批评,推理性能越跑越强
|
24天前
|
人工智能 搜索推荐 前端开发
OpenDeepSearch:搜索引擎革命!这个开源深度搜索工具让AI代理直接读懂网页,复杂问题一键拆解
OpenDeepSearch是基于开源推理模型的深度搜索工具,通过语义重排和多源整合优化检索效果,支持与AI代理无缝集成,提供快速和专业两种搜索模式。
152 10
OpenDeepSearch:搜索引擎革命!这个开源深度搜索工具让AI代理直接读懂网页,复杂问题一键拆解
|
5天前
|
人工智能 Java 开发者
通义灵码:当AI成为你的编程搭档,效率革命已经到来
本文介绍了通义灵码作为AI编程伙伴的革命性意义及其技术特点。基于阿里云通义代码大模型CodeQwen1.5,它具备多模态代码理解、意图推理和跨语言知识融合能力,可重构开发者工作流,从智能编码到Debug预警再到文档自动化全面提升效率。数据显示,其能将常规开发时间缩短60%,错误率下降43%,新技术上手速度提升2倍。未来,通义灵码将推动需求-代码双向翻译、架构自演进等全新编程形态,助力开发者聚焦更高价值领域,开启人机共生的编程新时代。
58 9
|
28天前
|
存储 人工智能 编解码
TripoSF:3D建模内存暴降80%!VAST AI新一代模型细节狂飙82%
TripoSF 是 VAST AI 推出的新一代 3D 基础模型,采用创新的 SparseFlex 表示方法,支持 1024³ 高分辨率建模,内存占用降低 82%,在细节捕捉和复杂结构处理上表现优异。
79 10
TripoSF:3D建模内存暴降80%!VAST AI新一代模型细节狂飙82%
|
28天前
|
人工智能 自然语言处理
TxGemma:谷歌DeepMind革命药物研发!270亿参数AI药理学家24小时在线
谷歌推出专为药物研发设计的TxGemma大模型,具备药物特性预测、生物文献筛选、多步推理等核心能力,提供20亿至270亿参数版本,显著提升治疗开发效率。
95 7
TxGemma:谷歌DeepMind革命药物研发!270亿参数AI药理学家24小时在线

热门文章

最新文章

下一篇
oss创建bucket