CapsuleNet(了解)

简介: CapsuleNet(了解)

学习目标



  • 目标
  • 了解CapsuleNet
  • 应用


5.3.1 CapsuleNet为什么会出现



2017年,CapsuleNet的出现是Hinton大佬对于卷积神经网络等的思考,想去构建一种新的网络结构, 如何克服CNN存在的问题的,那CN网络又存在什么问题:


  • CNN的目标不正确


1、CNN对于旋转类型图片不确定


CNN会认为下图的R是两个不同的字母,而这是由网络结构所带来的,这也造成了CNN所需的训练集要很大。


image.png


2、CNN对于图片整体结构关系不确定


  • 对于下面这张人脸图,CNN会认为这是张正确的图,因为只要存在一些关键结构即可,没有结构之间的联系
  • 解决了图像识别中的“毕加索问题”


image.png


  • Hinton认为人的视觉系统会有不一样的做法


  • 人的视觉系统会建立坐标框架,坐标框架是参与到识别过程中,识别过程受到了空间概念的支配


20200720224603725.gif


5.3.2 什么是CapsuleNet


胶囊神经网络(CapsuleNet)是一种机器学习系统,该方法试图更接近地模仿生物神经组织,该想法是将称为胶囊的结构添加到CNN当中。


论文地址:https://arxiv.org/pdf/1710.09829.pdf


5.3.2.1 改进特点


  • 添加一个Capsule层


Capsule 是一组神经元,其输入输出向量表示特定实体类型的实例化参数(即特定物体、概念实体等出现的概率与某些属性)。


假设有手写数字10类别的分类任务,比如说10 x 16,输出表示了图像中存在的特定实体16个的各种性质。例如姿势(位置,大小,方向)、变形、速度、反射率,色彩、纹理等等。


  • 输入输出向量的长度表示了某个实体出现的概率,所以它的值必须在 0 到 1 之间。


5.3.2.2 结构


image.png


  • 第一个卷积层:使用了256个9×9 卷积核,步幅为 1,ReLU 激活函数。输出的张量才能是20×20×256
  • 第二个卷积层:作为Capsule层的输入而构建相应的张量结构。


  • 32个,9×9 的卷积核,步幅为 2下做卷积, 得到6×6×32的张量,等价于 6×6×1×32
  • 8 次不同权重的 Conv2d 操作,得到6 x 6 x 8 x 32
  • 理解:6×6×32=1152Capsule单元,每个向量长度为8


  • 第三层:有10个标准的Capsule单元,每个Capsule的输出向量有16 个元素,10 X 16
  • 参数:
  • W_{i,j}Wi,j有1152×10个,每个是8×16的向量


5.3.2.3 效果


  • Capsules on MNIST
  • 达到约0.25%的错误率,相比之前CNN0.39%的错误率提高


5.3.4 总结



了解CapsuleNet


目录
相关文章
|
10月前
|
机器学习/深度学习 自然语言处理 计算机视觉
【计算机视觉】MDETR - Modulated Detection for End-to-End Multi-Modal Understanding
对于图像模型,MDETR采用的是一个CNN backbone来提取视觉特征,然后加上二维的位置编码;对于语言模态,作者采用了一个预训练好的Transformer语言模型来生成与输入值相同大小的hidden state。然后作者采用了一个模态相关的Linear Projection将图像和文本特征映射到一个共享的embedding空间。 接着,将图像embedding和语言embedding进行concat,生成一个样本的图像和文本特征序列。这个序列特征首先被送入到一个Cross Encoder进行处理,后面的步骤就和DETR一样,设置Object Query用于预测目标框。
|
12月前
|
搜索推荐 索引
Term Suggester 中 suggest_mode 的三种模式missing、popular、always 的区别
Term Suggester 中 suggest_mode 的三种模式missing、popular、always 的区别
|
Shell Android开发
In Android, AccessibilityService is used to simulate click events
If you want to perform some simulated click action in Android, you usually have to use ADB and accessibility without modifying the page's source code.
288 0
|
TensorFlow 算法框架/工具
成功解决AttributeError: module tensorflow.image has no attribute resize
成功解决AttributeError: module tensorflow.image has no attribute resize
|
开发工具 Android开发
Error while waiting for device: The emulator process for AVD Pixel_API_30 has terminated.
Error while waiting for device: The emulator process for AVD Pixel_API_30 has terminated.
2880 0
Error while waiting for device: The emulator process for AVD Pixel_API_30 has terminated.
|
开发工具 Android开发
Error while waiting for device: The emulator process for AVD Pixel_2_XL_API_28 was killed.
Error while waiting for device: The emulator process for AVD Pixel_2_XL_API_28 was killed.
969 0
Error while waiting for device: The emulator process for AVD Pixel_2_XL_API_28 was killed.
如何对SNP设计引物: CAPS, dCAPS
最近一直在帮师姐根据SNP找基因组上的酶切多态位点,然后给她提供该位点附近1kb的序列,让她去设计引物。由于我本科就做过一点点的遗传定位,当时用的是SSCP(单分子构象多态性)去区分单个碱基差异,所以我对SNP分子比较的检测方法就局限在高通量测序和SSCP而已。
2579 0