PersonaCraft:首尔国立大学推出的单参考图像生成多身份全身图像技术

本文涉及的产品
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,图像资源包5000点
简介: PersonaCraft是由首尔国立大学推出的创新技术,能够从单一参考图像生成多个人物的逼真全身图像。该技术结合了扩散模型和3D人类建模,有效处理人物间的遮挡问题,并支持用户自定义身体形状调整,为多人图像合成树立了新标准。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 技术背景:PersonaCraft结合了扩散模型和3D人类建模,能够从单一参考图像生成多个人物的逼真全身图像。
  2. 主要功能:支持多人物图像合成、遮挡处理、全身个性化以及用户定义身体形状控制。
  3. 应用场景:广泛应用于社交媒体、广告与营销、时尚与服装、游戏与娱乐以及电影与动画制作等领域。

正文

PersonaCraft 是什么

公众号: 蚝油菜花 - PersonaCraft

PersonaCraft是韩国首尔国立大学推出的个性化全身图像合成技术,结合扩散模型和3D人类建模,能从单一参考图像生成多个人物的逼真、个性化全身图像。PersonaCraft能有效处理人物间的遮挡问题,支持用户自定义身体形状调整,实现更灵活的个性化定制。

基于精确控制身体姿态和形状,PersonaCraft在复杂场景中生成高质量图像方面表现出色,为多人图像合成树立了新标准。

PersonaCraft 的主要功能

  • 多人物图像合成:根据单一参考图像生成包含多个人物的逼真图像。
  • 遮挡处理:有效管理人物间的遮挡问题,确保图像中每个人物的身体部分都能准确展现。
  • 全身个性化:不仅关注面部身份的个性化,还能准确个性化每个人的全身形状。
  • 用户定义身体形状控制:用户根据个人喜好调整生成人物的身体比例和形状。
  • 3D感知姿态条件控制:用SMPLx-ControlNet(SCNet)进行3D感知的姿态条件控制,提高身体形状和姿态的准确性。

PersonaCraft 的技术原理

  • 3D人类建模与扩散模型结合:PersonaCraft整合3D人类建模(特别是SMPLx模型)和扩散模型,增强对人物身体形状和姿态的控制。
  • SMPLx-ControlNet(SCNet):用SMPLx模型生成的深度图作为条件信号,准确捕捉身体形状和姿态,有效处理复杂的遮挡问题。
  • 面部和身体身份提取:基于InsightFace等技术从参考图像中提取面部身份嵌入,用SMPLx拟合方法提取身体形状参数。
  • 3D感知姿态条件:与传统的2D骨架姿势条件不同,PersonaCraft用3D姿势信息,提供更全面的人体姿势表示,包括深度信息。
  • 多人个性化图像合成:结合SCNet和IdentityNet,使用面部掩码准确定位身份,实现多人身份的个性化图像合成。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
2天前
|
人工智能 算法
图像伪造照妖镜!北大发布多模态LLM图像篡改检测定位框架FakeShield
北京大学研究团队提出了一种名为FakeShield的多模态框架,旨在解决图像伪造检测与定位(IFDL)中的黑箱问题及泛化能力不足。FakeShield不仅能评估图像真实性,生成篡改区域的掩码,还能提供像素级和图像级的篡改线索及详细文本描述,增强检测的可解释性。通过使用GPT-4o增强现有数据集,创建多模态篡改描述数据集(MMTD-Set),并引入领域标签引导的可解释伪造检测模块(DTE-FDM)和多模态伪造定位模块(MFLM),FakeShield在多种篡改技术的检测与定位上表现优异,为图像真实性维护提供了有力工具。
27 14
|
29天前
|
人工智能 小程序
【一步步开发AI运动小程序】五、帧图像人体识别
随着AI技术的发展,阿里体育等公司推出的AI运动APP,如“乐动力”和“天天跳绳”,使云上运动会、线上健身等概念广受欢迎。本文将引导您从零开始开发一个AI运动小程序,使用“云智AI运动识别小程序插件”。文章分为四部分:初始化人体识别功能、调用人体识别功能、人体识别结果处理以及识别结果旋转矫正。下篇将继续介绍人体骨骼图绘制。
|
4月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之是否支持对敏感内容进行马赛克处理
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
趋势来袭!大模型时代的文档图像发展与图像安全剖析
趋势来袭!大模型时代的文档图像发展与图像安全剖析
67 1
|
6月前
|
文字识别 Linux API
视觉智能开放平台产品使用合集之图像构图美学评分的标准是什么
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
6月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之摄像头一直未捕捉到用户脸部,会如何提示
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
6月前
|
编解码 文字识别 搜索推荐
视觉智能开放平台产品使用合集之生成式图像卡通化功能在哪里可以找到
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
7月前
|
机器学习/深度学习 算法 计算机视觉
视觉智能平台常见问题之调用人像素描接口传全身照时报错如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
|
7月前
|
机器学习/深度学习 API Android开发
视觉智能平台常见问题之摄像头抓拍到包含人脸的照片如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
视觉智能平台常见问题之摄像头抓拍到包含人脸的照片如何解决
|
7月前
|
人工智能 编解码 数据安全/隐私保护
才发现百度自带的AI图片助手这么好用,去水印、画质优化、AI扩图、涂抹消除等功能一应俱全!
才发现百度自带的AI图片助手这么好用,去水印、画质优化、AI扩图、涂抹消除等功能一应俱全!
1015 0

热门文章

最新文章