《中国人工智能学会通讯》——11.51 基于幻象技术的异质人脸图像合成

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第11章,第11.51节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

11.51 基于幻象技术的异质人脸图像合成

基于稀疏特征选择的方法,以及现有的大部分算法在合成人脸图像时,多是采用线性组合的方式。线性组合,即线性加权平均,可以看作一低通滤波器,会过滤掉一些高频细节信息,如图2所示。此外,由于现有的异质人脸图像合成算法对图像分块多采用相邻块覆盖的方式,故在最后融合生成一整张人脸时需要将重叠区域平均,这也会带来一定的模糊效应,过滤掉部分高频细节信息。image
那么是否能够通过学习输入测试照片到残差图像之间的映射关系来学习丢失的高频细节信息?而人脸幻象 (face hallucination),即人脸超分辨重建,一般是在中低频的初始估计基础上加上学习得到的高频细节信息,这与我们的任务不谋而合。受人脸幻象思想启发,因此提出如何在初始估计基础上学习得到丢失的高频信息以进一步提高合成人脸图像的质量。

受两步人脸幻象[13]框架启发,提出一种两步框架来进一步增强合成图像的高频细节。所提出的框架步骤为(以人脸画像合成为例):第一步,利用第二章中介绍的基于稀疏特征选择的人脸图像合成方法合成一张初始估计,这里也可以用现有的其他基于线性组合的方法;第二步,利用支撑向量回归(Support Vector Regression,SVR) 学习照片和画像高频细节之间的映射关系,并对输入的照片进行高频信息的估计;最后将两步分别得到的初始估计与残差图像进行叠加得到最终输出的合成画像。下面主要介绍基于支撑向量回归的幻象部分,即残差补偿。

这里定义的高频信息为图像块灰度值减去块均值。支撑向量回归模型的输入特征取为图像块的灰度值减去块均值,输出为对应模态图像块中心像素的灰度值减去块均值。为了进一步提高学习的效率和效果,首先将图像块聚类,然后每个类分别学习一个 SVR模型。测试阶段,对于每个图像块,首先根据聚类中心选择距离最近的类对应的支撑向量回归模型,进而进行高频信息的回归,算法框图如图 3 所示。

训练阶段,首先对训练画像 - 照片对分成一些均匀大小的块,块与块之间保持一定的重叠区域;然后用 K-means 聚类方法将这些块聚成 M 类,每一类利用支撑向量回归训练得到一回归模型。我们采用 LIBSVM( 采用默认参数 ) 进行训练。测试阶段,先对输入照片进行与训练阶段同样的分块,提取特征;然后对于每个块根据与各个类中心的欧式距离寻找最近邻的类,随后用对应的 SVR 模型进行回归得到输出高频图像对应块中心的高频值。将所有合成的这些高频信息重新排列即可得高频细节图像。最后将所得高频细节图像加到初始估计上,即可得到最终的合成结果。

image

相关文章
|
6月前
|
人工智能 数据安全/隐私保护
如何识别AI生成内容?探秘“AI指纹”检测技术
如何识别AI生成内容?探秘“AI指纹”检测技术
1096 119
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
AI检测技术:如何识别机器生成的“数字指纹”?
AI检测技术:如何识别机器生成的“数字指纹”?
398 115
|
6月前
|
人工智能 自然语言处理 算法
揭秘AI文本:当前主流检测技术与挑战
揭秘AI文本:当前主流检测技术与挑战
1031 115
|
6月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
6月前
|
人工智能 新制造
TsingtaoAI受邀参加宁波AI海曙科创训练营并分享技术落地实践
10月12日至15日,由宁波市海曙区组织部主办的AI海曙科创训练营在宁波成功举办。作为受邀企业代表,TsingtaoAI团队深入参与了多项活动,与政府领导、行业专家及科创企业代表围绕AI技术在制造业、成果转化等领域的实际应用展开交流,用真实案例诠释了“技术扎根产业”的价值逻辑。
181 2
|
6月前
|
机器学习/深度学习 人工智能 算法
AI可以做电商主图了:技术原理,AI电商图生成工具对比及技术解析
双十一临近,电商主图需求激增。AI技术凭借多图融合、扩散模型等,实现高效智能设计,30秒生成高质量主图,远超传统PS效率。支持风格迁移、背景替换、文案生成,助力商家快速打造吸睛商品图,提升转化率。
1877 0
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
如何准确检测AI生成内容?这三大技术是关键
如何准确检测AI生成内容?这三大技术是关键
1040 116
|
6月前
|
人工智能 机器人 人机交互
当AI学会“看、听、懂”:多模态技术的现在与未来
当AI学会“看、听、懂”:多模态技术的现在与未来
426 117
|
6月前
|
机器学习/深度学习 人工智能 算法
AI生成内容的“指纹”与检测技术初探
AI生成内容的“指纹”与检测技术初探
878 9

热门文章

最新文章