【学习记录】《DeepLearning.ai》第十三课:特殊应用:人脸识别和神经风格转换(Specialapoplications:Face recognition&Neural style transfer)

简介: 2021/9/13

第十三课:特殊应用:人脸识别和神经风格转换(Specialapoplications:Face recognition&Neural style transfer)

4.1 什么是人脸识别?

科普

人脸识别可能一个人的识别准确率是99%,那么100个人的识别可能需要更高的准确率,99.9%等等。


4.2 One-Shot学习

人脸识别所面临的一个挑战就是需要解决一次学习问题,要想让人脸识别做到一次学习,应该使用Similarity函数,如下图:

image

查看输入的两张图片(img1,img2)的差异性,如果差异性小于一个数,说明相同,差异性大于一个数,说明不相同。

image


4.3 Siamese网络(Siamese network)

image

image

Siamese网络就是首先定义了一个编码函数,对于输入的函数,能够输出一个128维编码,如果两个输入对应的输出的范数比较小,就是同一个人,相反,就是不同的人。


4.4 Triplet损失

定义三元组损失函数然后应用梯度下降

image

image

上面的公式是损失函数,给出3个图片,A、P、N,其中A和P是同一个人,A和N是不同的人,定义损失函数如上,$+\alpha$​是为了防止损失函数大于0,损失函数的目的是确保损失函数等于0。

只要损失函数小于0,则损失函数就是0.

上面的A、P、N就是三元组。

三元组的选择不能太随意,要选择很难训练的A、P、N。下图是解释:

image


4.5 人脸验证与二分类(Face verification and binary classification)

可以把人脸识别当做二分类问题。

定义输出$\widehat{y}$如下:

image

image

如果相同输出1,相反输出0

4.6 神经风格迁移(Neural style transfer)

image

不得不说,第二张合成图好阴间。。。

C表示内容图像,S表示风格图像,G表示生成的图像。


4.7 深度卷积网络学习什么?(What are deep ConvNets learning?)

image

网络第一层能检测出一些边缘或颜色阴影等,随着层数的加深,能够检测到更复杂的东西。图中举例的每个方框代表了不同的9个代表性神经元。


4.8 神经风格迁移系统的代价函数

image

神经风格迁移系统的代价函数:

$$ J(G)=\alpha {J_{content}}(C,G)+\beta J_{style}(S,G) $$

第一个是内容代价函数,第二个是风格代价函数。

前面的系数表示权重

image

上面定义了一个生成图片G的代价函数,并将其最小化。


4.9 内容代价函数(Content cost function)

用$a^{[l][C]}$​和$a^{[l][G]}$​来代表两个图片C和G的l层的激活函数值。如果两个激活值相似,那么就意味着两个图片的内容相似,因此:

内容代价函数:

$$ J_{content}(C,G)=\frac{1}{2}||a^{[l][C]}-a^{[l][G]}||^2 $$

通过超参数$\alpha$来调整代价函数。


4.10 风格代价函数(Style cost function)

没怎么看懂,给出了一个风格代价函数。


4.11 一维和三维推广

之前讲的卷积都是在2D上讨论的,当然可以以相同的方式来推广到1D和3D空间。


OVER!

相关文章
|
3月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
565 30
|
3月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
554 1
|
3月前
|
消息中间件 人工智能 安全
构建企业级 AI 应用:为什么我们需要 AI 中间件?
阿里云发布AI中间件,涵盖AgentScope-Java、AI MQ、Higress、Nacos及可观测体系,全面开源核心技术,助力企业构建分布式多Agent架构,推动AI原生应用规模化落地。
445 0
构建企业级 AI 应用:为什么我们需要 AI 中间件?
|
3月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
3月前
|
人工智能 算法 Java
Java与AI驱动区块链:构建智能合约与去中心化AI应用
区块链技术和人工智能的融合正在开创去中心化智能应用的新纪元。本文深入探讨如何使用Java构建AI驱动的区块链应用,涵盖智能合约开发、去中心化AI模型训练与推理、数据隐私保护以及通证经济激励等核心主题。我们将完整展示从区块链基础集成、智能合约编写、AI模型上链到去中心化应用(DApp)开发的全流程,为构建下一代可信、透明的智能去中心化系统提供完整技术方案。
342 3
|
3月前
|
人工智能 安全 Serverless
再看 AI 网关:助力 AI 应用创新的关键基础设施
AI 网关作为云产品推出已有半年的时间,这半年的时间里,AI 网关从内核到外在都进行了大量的进化,本文将从 AI 网关的诞生、AI 网关的产品能力、AI 网关的开放生态,以及新推出的 Serverless 版,对其进行一个全面的介绍,期望对正在进行 AI 应用落地的朋友,在 AI 基础设施选型方面提供一些参考。
784 73
|
3月前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
716 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
|
3月前
|
人工智能 安全 中间件
构建企业级 AI 应用:为什么我们需要 AI 中间件?
阿里云发布AI中间件,推出AgentScope-Java、AI MQ、Higress网关、Nacos注册中心及可观测体系,全面开源核心技术,构建分布式多Agent架构基座,助力企业级AI应用规模化落地,推动AI原生应用进入新范式。
768 26
|
3月前
|
人工智能 安全 数据可视化
Dify让你拖拽式搭建企业级AI应用
Dify是开源大模型应用开发平台,融合BaaS与LLMOps理念,通过可视化工作流、低代码编排和企业级监控,支持多模型接入与RAG知识库,助力企业快速构建安全可控的AI应用,实现从原型到生产的高效落地。
Dify让你拖拽式搭建企业级AI应用
|
3月前
|
机器学习/深度学习 人工智能 搜索推荐
拔俗AI学伴智能体系统:基于大模型与智能体架构的下一代个性化学习引擎
AI学伴智能体系统融合大模型、多模态理解与自主决策,打造具备思考能力的个性化学习伙伴。通过动态推理、长期记忆、任务规划与教学逻辑优化,实现千人千面的自适应教育,助力因材施教落地,推动教育公平与效率双提升。(238字)
578 0