1 目录
- 计算机视觉
- 卷积神经网络
- 卷积
- 池化
- 特征可视化
2 计算机视觉
计算机视觉发展比较早,在1966年就有相关CV的人工智能论文
计算机视觉应用雏形:
相关应用:
- 图片分类
- 目标识别
- 物体标注
- Pose 识别
- 图标标题生成
- 图片内容理解
- 视觉问答
- 图像生成
- 迁移学习
3 卷积神经网络
我们先回顾下全连接网络:
全连接神经网络(fully connected neural network),顾名思义,就是相邻两层之间任意两个节点之间都有连接。全连接神经网络是最为普通的一种模型(比如和CNN相比),由于是全连接,所以会有更多到权重值和连接,因此也意味着占用更多到内存和计算。
image
卷积神经网络的示意图如下:
4 卷积
卷积不是一个新的概念,在很早以前的索贝算子就应用到,在影像处理及电脑视觉领域中常被用来做边缘检测
更过卷积的操作,原先写过一篇文章,这里不再赘述
下面是课件对input、filter、stride之间关系总的总结:
tensorflow的卷积层:
TensorFlow的padding操作:
5 池化
池化层的作用: 1. 不变性,更关注是否存在某些特征而不是特征具体的位置。可以看作加了一个很强的先验,让学到的特征要能容忍一些的变化。2. 减小下一层输入大小,减小计算量和参数个数。3. 获得定长输出。(文本分类的时候输入是不定长的,可以通过池化获得定长输出)4. 防止过拟合或有可能会带来欠拟合。
最大池化
一些卷积神经网络变体:
- LeNet-5
- AlexNet
- VGGNet
- GoogLeNet
- ResNet