《中国人工智能学会通讯》——11.51 基于幻象技术的异质人脸图像合成

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第11章,第11.51节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

11.51 基于幻象技术的异质人脸图像合成

基于稀疏特征选择的方法,以及现有的大部分算法在合成人脸图像时,多是采用线性组合的方式。线性组合,即线性加权平均,可以看作一低通滤波器,会过滤掉一些高频细节信息,如图2所示。此外,由于现有的异质人脸图像合成算法对图像分块多采用相邻块覆盖的方式,故在最后融合生成一整张人脸时需要将重叠区域平均,这也会带来一定的模糊效应,过滤掉部分高频细节信息。image
那么是否能够通过学习输入测试照片到残差图像之间的映射关系来学习丢失的高频细节信息?而人脸幻象 (face hallucination),即人脸超分辨重建,一般是在中低频的初始估计基础上加上学习得到的高频细节信息,这与我们的任务不谋而合。受人脸幻象思想启发,因此提出如何在初始估计基础上学习得到丢失的高频信息以进一步提高合成人脸图像的质量。

受两步人脸幻象[13]框架启发,提出一种两步框架来进一步增强合成图像的高频细节。所提出的框架步骤为(以人脸画像合成为例):第一步,利用第二章中介绍的基于稀疏特征选择的人脸图像合成方法合成一张初始估计,这里也可以用现有的其他基于线性组合的方法;第二步,利用支撑向量回归(Support Vector Regression,SVR) 学习照片和画像高频细节之间的映射关系,并对输入的照片进行高频信息的估计;最后将两步分别得到的初始估计与残差图像进行叠加得到最终输出的合成画像。下面主要介绍基于支撑向量回归的幻象部分,即残差补偿。

这里定义的高频信息为图像块灰度值减去块均值。支撑向量回归模型的输入特征取为图像块的灰度值减去块均值,输出为对应模态图像块中心像素的灰度值减去块均值。为了进一步提高学习的效率和效果,首先将图像块聚类,然后每个类分别学习一个 SVR模型。测试阶段,对于每个图像块,首先根据聚类中心选择距离最近的类对应的支撑向量回归模型,进而进行高频信息的回归,算法框图如图 3 所示。

训练阶段,首先对训练画像 - 照片对分成一些均匀大小的块,块与块之间保持一定的重叠区域;然后用 K-means 聚类方法将这些块聚成 M 类,每一类利用支撑向量回归训练得到一回归模型。我们采用 LIBSVM( 采用默认参数 ) 进行训练。测试阶段,先对输入照片进行与训练阶段同样的分块,提取特征;然后对于每个块根据与各个类中心的欧式距离寻找最近邻的类,随后用对应的 SVR 模型进行回归得到输出高频图像对应块中心的高频值。将所有合成的这些高频信息重新排列即可得高频细节图像。最后将所得高频细节图像加到初始估计上,即可得到最终的合成结果。

image

相关文章
|
13天前
|
人工智能 自然语言处理 机器人
文档智能与RAG技术如何提升AI大模型的业务理解能力
随着人工智能的发展,AI大模型在自然语言处理中的应用日益广泛。文档智能和检索增强生成(RAG)技术的兴起,为模型更好地理解和适应特定业务场景提供了新方案。文档智能通过自动化提取和分析非结构化文档中的信息,提高工作效率和准确性。RAG结合检索机制和生成模型,利用外部知识库提高生成内容的相关性和准确性。两者的结合进一步增强了AI大模型的业务理解能力,助力企业数字化转型。
62 3
|
23天前
|
人工智能 搜索推荐 安全
AI技术在医疗领域的应用与挑战
【10月更文挑战第27天】 本文探讨了人工智能(AI)在医疗领域的应用,包括疾病诊断、药物研发和患者管理等方面。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题和技术局限性等。通过对这些方面的深入分析,我们可以更好地理解AI在医疗领域的潜力和发展方向。
128 59
|
4天前
|
机器学习/深度学习 人工智能 搜索推荐
AI技术在医疗领域的应用####
本文探讨了人工智能(AI)技术在医疗领域的创新应用及其带来的革命性变化。通过分析AI在疾病诊断、个性化治疗、药物研发和患者管理等方面的具体案例,展示了AI如何提升医疗服务的效率和准确性。此外,文章还讨论了AI技术面临的挑战与伦理问题,并展望了未来的发展趋势。 ####
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术在医疗领域的应用与前景####
本文探讨了人工智能(AI)在医疗领域的多方面应用,包括疾病诊断、个性化治疗、患者管理以及药物研发等。通过对现有技术的梳理和未来趋势的展望,旨在揭示AI如何推动医疗行业的变革,并提升医疗服务的质量和效率。 ####
28 5
|
11天前
|
人工智能 文字识别 运维
AI多模态的5大核心关键技术,让高端制造实现智能化管理
结合大模型应用场景,通过AI技术解析高端制造业的复杂设备与文档数据,自动化地将大型零件、机械图纸、操作手册等文档结构化。核心技术包括版面识别、表格抽取、要素抽取和文档抽取,实现信息的系统化管理和高效查询,大幅提升设备维护和生产管理的效率。
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与深度学习:探索未来技术的无限可能
在21世纪,人工智能(AI)和深度学习已经成为推动科技进步的重要力量。本文将深入探讨这两种技术的基本概念、发展历程以及它们如何共同塑造未来的科技景观。我们将分析人工智能的最新趋势,包括自然语言处理、计算机视觉和强化学习,并讨论这些技术在现实世界中的应用。此外,我们还将探讨深度学习的工作原理,包括神经网络、卷积神经网络(CNN)和循环神经网络(RNN),并分析这些模型如何帮助解决复杂的问题。通过本文,读者将对人工智能和深度学习有更深入的了解,并能够预见这些技术将如何继续影响我们的世界。
48 7
|
13天前
|
人工智能 自然语言处理 自动驾驶
技术与人性:探索人工智能伦理的边界####
本文深入探讨了人工智能技术飞速发展背景下,伴随而来的伦理挑战与社会责任。不同于传统摘要直接概述内容,本文摘要旨在引发读者对AI伦理问题的关注,通过提出而非解答的方式,激发对文章主题的兴趣。在智能机器逐渐融入人类生活的每一个角落时,我们如何确保技术的善意使用,保护个人隐私,避免偏见与歧视,成为亟待解决的关键议题。 ####
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
思通数科AI平台在尽职调查中的技术解析与应用
思通数科AI多模态能力平台结合OCR、NLP和深度学习技术,为IPO尽职调查、融资等重要交易环节提供智能化解决方案。平台自动识别、提取并分类海量文档,实现高效数据核验与合规性检查,显著提升审查速度和精准度,同时保障敏感信息管理和数据安全。
76 11
|
16天前
|
人工智能 自然语言处理 算法
企业内训|AI/大模型/智能体的测评/评估技术-某电信运营商互联网研发中心
本课程是TsingtaoAI专为某电信运营商的互联网研发中心的AI算法工程师设计,已于近日在广州对客户团队完成交付。课程聚焦AI算法工程师在AI、大模型和智能体的测评/评估技术中的关键能力建设,深入探讨如何基于当前先进的AI、大模型与智能体技术,构建符合实际场景需求的科学测评体系。课程内容涵盖大模型及智能体的基础理论、测评集构建、评分标准、自动化与人工测评方法,以及特定垂直场景下的测评实战等方面。
73 4
|
16天前
|
机器学习/深度学习 人工智能 算法
基于AI的性能优化技术研究
基于AI的性能优化技术研究
下一篇
无影云桌面