【学习记录】《DeepLearning.ai》第十三课:特殊应用:人脸识别和神经风格转换(Specialapoplications:Face recognition&Neural style transfer)

简介: 2021/9/13

第十三课:特殊应用:人脸识别和神经风格转换(Specialapoplications:Face recognition&Neural style transfer)

4.1 什么是人脸识别?

科普

人脸识别可能一个人的识别准确率是99%,那么100个人的识别可能需要更高的准确率,99.9%等等。


4.2 One-Shot学习

人脸识别所面临的一个挑战就是需要解决一次学习问题,要想让人脸识别做到一次学习,应该使用Similarity函数,如下图:

image

查看输入的两张图片(img1,img2)的差异性,如果差异性小于一个数,说明相同,差异性大于一个数,说明不相同。

image


4.3 Siamese网络(Siamese network)

image

image

Siamese网络就是首先定义了一个编码函数,对于输入的函数,能够输出一个128维编码,如果两个输入对应的输出的范数比较小,就是同一个人,相反,就是不同的人。


4.4 Triplet损失

定义三元组损失函数然后应用梯度下降

image

image

上面的公式是损失函数,给出3个图片,A、P、N,其中A和P是同一个人,A和N是不同的人,定义损失函数如上,$+\alpha$​是为了防止损失函数大于0,损失函数的目的是确保损失函数等于0。

只要损失函数小于0,则损失函数就是0.

上面的A、P、N就是三元组。

三元组的选择不能太随意,要选择很难训练的A、P、N。下图是解释:

image


4.5 人脸验证与二分类(Face verification and binary classification)

可以把人脸识别当做二分类问题。

定义输出$\widehat{y}$如下:

image

image

如果相同输出1,相反输出0

4.6 神经风格迁移(Neural style transfer)

image

不得不说,第二张合成图好阴间。。。

C表示内容图像,S表示风格图像,G表示生成的图像。


4.7 深度卷积网络学习什么?(What are deep ConvNets learning?)

image

网络第一层能检测出一些边缘或颜色阴影等,随着层数的加深,能够检测到更复杂的东西。图中举例的每个方框代表了不同的9个代表性神经元。


4.8 神经风格迁移系统的代价函数

image

神经风格迁移系统的代价函数:

$$ J(G)=\alpha {J_{content}}(C,G)+\beta J_{style}(S,G) $$

第一个是内容代价函数,第二个是风格代价函数。

前面的系数表示权重

image

上面定义了一个生成图片G的代价函数,并将其最小化。


4.9 内容代价函数(Content cost function)

用$a^{[l][C]}$​和$a^{[l][G]}$​来代表两个图片C和G的l层的激活函数值。如果两个激活值相似,那么就意味着两个图片的内容相似,因此:

内容代价函数:

$$ J_{content}(C,G)=\frac{1}{2}||a^{[l][C]}-a^{[l][G]}||^2 $$

通过超参数$\alpha$来调整代价函数。


4.10 风格代价函数(Style cost function)

没怎么看懂,给出了一个风格代价函数。


4.11 一维和三维推广

之前讲的卷积都是在2D上讨论的,当然可以以相同的方式来推广到1D和3D空间。


OVER!

相关文章
|
7月前
|
人工智能 自然语言处理 搜索推荐
上下文学习的神奇魔法:轻松理解AI如何无师自通
你有没有想过,为什么给GPT几个例子,它就能学会新任务?这就像魔法一样!本文用轻松幽默的方式解密上下文学习的原理,通过「智能客服训练」场景,带你理解AI如何像人类一样从示例中学习,无需额外训练就能掌握新技能。
280 28
|
5月前
|
人工智能 小程序 Java
电子班牌管理系统源代码,基于AI人脸识别技术的智能电子班牌云平台解决方案
电子班牌管理系统源码,基于AI人脸识别的智慧校园云平台,支持SaaS架构,涵盖管理端、小程序与安卓班牌端。集成考勤、课表、通知、门禁等功能,提供多模式展示与教务联动,助力校园智能化管理。
253 0
|
6月前
|
存储 人工智能 搜索推荐
一种专为AI代理设计的内存层,能够在交互过程中记忆、学习和进化
Mem0 是专为 AI 代理设计的内存层,支持记忆、学习与进化。提供多种记忆类型,可快速集成,适用于开源与托管场景,助力 AI 代理高效交互与成长。
678 123
一种专为AI代理设计的内存层,能够在交互过程中记忆、学习和进化
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
迁移学习:让小数据也能驱动AI大模型
迁移学习:让小数据也能驱动AI大模型
405 99
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
教育领域的AI进展:智能辅导与个性化学习的技术革新与挑战
随着人工智能技术的发展,AI Agent在教育领域的应用日益广泛,特别是在智能辅导与个性化学习方面展现出巨大潜力。通过自然语言处理、机器学习和数据分析等技术,AI可模拟个性化辅导员,根据学生的学习情况提供定制化资源与实时反馈。未来,AI Agent将更注重情感分析与跨学科培养,成为教师的有力助手,推动教育公平与效率提升。然而,数据隐私、个体差异及教育资源不平衡等问题仍需克服,以实现更智能化、全面化的教育生态。
801 10
教育领域的AI进展:智能辅导与个性化学习的技术革新与挑战
|
7月前
|
数据采集 人工智能 前端开发
AI智能体如何从错误中学习:反思机制详解
探索AI智能体的反思能力:从哲学思考到技术实现,看AI如何像人类一样从错误中学习和成长。通过轻松有趣的方式,深入了解Reflexion和ReAct等前沿框架,掌握让AI更智能的核心秘密。
532 0
|
7月前
|
机器学习/深度学习 人工智能 PyTorch
GPT为定制AI应用工程师转型第一周学习计划
本计划帮助开发者快速入门AI领域,首周涵盖AI基础理论、Python编程及PyTorch实战。前两天学习机器学习、深度学习与Transformer核心概念,掌握LLM工作原理。第三至四天快速掌握Python语法与Jupyter使用,完成基础编程任务。第五至七天学习PyTorch,动手训练MNIST手写识别模型,理解Tensor操作与神经网络构建。
346 0
|
8月前
|
人工智能 自然语言处理 搜索推荐
学霸养成计划:AI如何打造你的专属“学习外挂”?
学霸养成计划:AI如何打造你的专属“学习外挂”?
197 0
|
5月前
|
人工智能 JavaScript 前端开发
GenSX (不一样的AI应用框架)架构学习指南
GenSX 是一个基于 TypeScript 的函数式 AI 工作流框架,以“函数组合替代图编排”为核心理念。它通过纯函数组件、自动追踪与断点恢复等特性,让开发者用自然代码构建可追溯、易测试的 LLM 应用。支持多模型集成与插件化扩展,兼具灵活性与工程化优势。
392 6
|
12月前
|
人工智能 计算机视觉
HarmonyOS NEXT AI基础视觉服务-人脸识别
这是一个基于AI基础视觉服务的人脸识别案例,通过调用设备相册选择图片,利用MediaLibraryKit、ImageKit和CoreVisionKit等模块完成图像处理与人脸检测,并展示结构化结果。核心功能包括:相册访问授权、图像数据转换、人脸位置及特征点检测,最终以弹窗形式输出检测信息。代码涵盖模块导入、功能实现与UI构建,适合学习AI视觉应用开发流程。

热门文章

最新文章