python+tensorflow人脸识别(1)-深度学习基础概念

简介: python+tensorflow人脸识别(1)-深度学习基础概念

人脸识别是什么?

人脸识别,特指利用分析比较人脸视觉特征信息进行身份鉴别的计算机技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。

查阅相关资料发现,人脸识别的关键点是:目标检测,关键点定位,活体检测,相识度度量,人脸属性回归

什么是深度学习?

关于深度学习的前世今生,深度学习属于机器学习的一个分支,机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。机器学习在近30多年已发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。

目前我们人类所讲的人工智能,其实是弱人工智能,其不是能够能真正地推理和解决问题的智能机器,其实是只不过“看起来”像是智能的,也不会有自主意识。

我们通过给它大量的训练数据,让它去学习其这些数据内在的特征和关系,使其能够处理类似训练数据的实际问题。

机器学习中有许多经典的算法,其中有一个叫 人工神经网络 的算法,隐藏层比较多(大于2)的神经网络叫做深度神经网络。而深度学习,就是使用深层架构(比如,深度神经网络)的机器学习方法。深度学习通俗点讲就是神经网络的升级版。

这里简单介绍一下相关概念,大家感兴趣,可以去看一下斯坦福大学公开课:机器学习课程或者这篇文章(小牛感觉写的太牛了,有种通透的赶脚~~)

神经网络如图所示:输入层、隐藏层、输出层

image.png

什么是感知器?

感知器(英语:Perceptron)是Frank Rosenblatt在1957年就职于康奈尔航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络。它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类器。

神经网络的组成单元——神经元。神经元也叫做感知器。

感知器有如下部分:输入权值,激活函数,输出

  • 输出权值:一个感知器可以接收多个输入x_1x1,x_2x2... ,一个输入上有一个权值W_iWi,此外还有一个偏置项b。
  • 激活函数:感知器的激活函数可以有很多选择,我们选择这个经典的阶跃函数来作为激活函数:

f(z) = \begin{cases} 1 & z > 0 \\ 0 & z<=0 \end{cases}f(z)={10z>0z<=0

  • 输出:y=f(w * x + b)y=f(wx+b)

任何线性分类或线性回归问题,都可以用感知器来解决

多层感知器(MLP)也称人工神经网络(ANN)

深度学习中的概念变迁:神经元->感知器->神经网络->深度学习

前向运算

神经网络的前向运算,就是给定一组输入,计算输出的过程。

image.png

对于前向传播来说,不管维度多高,其过程都可以用如下公式表示:

假设上一层结点输入1,输入2,输入3,…等一些结点与本层的结点有连接,那么本层结点的值就是通过上一层的输入1,输入2,输入3结点以及对应的连接权值进行加权和运算,最终结果再加上一个偏置项(图中为了简单省略了),最后在通过一个非线性函数(即激活函数),如ReLu,sigmoid等函数,最后得到的结果就是本层结点的输出。

最终不断的通过这种方法一层层的运算,得到输出层结果。

a^2=a2= σ(z^2z2) = σ(a^1a1* w^2w2+b^2b2)

其中,上标代表层数,星号表示卷积,b表示偏置项bias,σ 表示激活函数。

假设我们构造了一个神经网络如下图:

image.png

公式如下:

image.png

其中f函数是本图规定的算法,Wij就是相邻两层神经元之间的权值,a_1^2a12是对x1,x2,x3进行线性组合,a_1^3a13是都a_1^2a12a_2^2a22a_3^2a32的线性组合

如何计算每层权值与偏值,f函数该如何定义,已知具体哪层,求其层的参数是多少?后面文章会一一道来。


本篇文章到这里就结束啦,如果喜欢的话,多多支持,欢迎关注!

参考:https://www.jiqizhixin.com/graph/technologies/f9849d6c-6262-4c1f-8f42-6d976be17161

https://www.zybuluo.com/hanbingtao/note/433855

https://cloud.tencent.com/developer/news/390591

https://blog.csdn.net/bitcarmanlee/article/details/78819025


本篇文章到这里就结束啦,如果喜欢的话,多多支持,欢迎关注!

相关文章
|
1天前
|
机器学习/深度学习 数据采集 自然语言处理
使用Python实现深度学习模型:智能社交媒体内容分析
使用Python实现深度学习模型:智能社交媒体内容分析
99 69
|
4天前
|
机器学习/深度学习 人工智能 算法
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
文本分类识别系统。本系统使用Python作为主要开发语言,首先收集了10种中文文本数据集("体育类", "财经类", "房产类", "家居类", "教育类", "科技类", "时尚类", "时政类", "游戏类", "娱乐类"),然后基于TensorFlow搭建CNN卷积神经网络算法模型。通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型,并保存为本地的h5格式。然后使用Django开发Web网页端操作界面,实现用户上传一段文本识别其所属的类别。
18 1
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
2天前
|
机器学习/深度学习 数据采集 自然语言处理
使用Python实现深度学习模型:智能新闻生成与校对
使用Python实现深度学习模型:智能新闻生成与校对
27 10
|
3天前
|
机器学习/深度学习 数据采集 自然语言处理
使用Python实现深度学习模型:智能广告创意生成
使用Python实现深度学习模型:智能广告创意生成
18 4
|
4天前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现深度学习模型:智能电影制作与剪辑
使用Python实现深度学习模型:智能电影制作与剪辑
25 5
|
4天前
|
机器学习/深度学习 人工智能 算法
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台。果蔬识别系统,本系统使用Python作为主要开发语言,通过收集了12种常见的水果和蔬菜('土豆', '圣女果', '大白菜', '大葱', '梨', '胡萝卜', '芒果', '苹果', '西红柿', '韭菜', '香蕉', '黄瓜'),然后基于TensorFlow库搭建CNN卷积神经网络算法模型,然后对数据集进行训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地文件方便后期调用。再使用Django框架搭建Web网页平台操作界面,实现用户上传一张果蔬图片识别其名称。
20 0
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
4月前
|
弹性计算 Java PHP
新手用户注册阿里云账号、实名认证、购买云服务器图文教程参考
对于初次购买阿里云产品的用户来说,第一步要做的是注册账号并完成实名认证,然后才是购买阿里云服务器或者其他云产品,本文为大家以图文形式展示一下新手用户从注册阿里云账号、实名认证到购买云服务器完整详细教程,以供参考。
新手用户注册阿里云账号、实名认证、购买云服务器图文教程参考
|
3月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之uniapp框架如何使用阿里云金融级人脸识别
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
机器学习/深度学习 搜索推荐 计算机视觉
【阿里云OpenVI-人脸感知理解系列之人脸识别】基于Transformer的人脸识别新框架TransFace ICCV-2023论文深入解读
本文介绍 阿里云开放视觉智能团队 被计算机视觉顶级国际会议ICCV 2023接收的论文 &quot;TransFace: Calibrating Transformer Training for Face Recognition from a Data-Centric Perspective&quot;。TransFace旨在探索ViT在人脸识别任务上表现不佳的原因,并从data-centric的角度去提升ViT在人脸识别任务上的性能。
2049 341