池化函数
在神经网络中,池化函数一般跟在卷积函数的下一层,池化操作是利用一个矩阵窗口在张量上进行扫描,将每个矩阵窗口中的值通过最大值或者平均值来减少元素的个数,每个池化操作的矩阵窗口大小是由ksize指定的,并且根据步长strides决定移动步长。
(1)计算池化区域中元素的平均值
- tf.nn.avg_pool(value, ksize, strides, padding, data_format=‘NHWC’, name=None)
- value:一个四维的张量。数据维度是[batch, height, width, channels]
- ksize:一个长度不小于4的整型数组。每一位上的值对应于输入数据张量中每一维的窗口对应值。
- strides:一个长度不小于4的整型数组。指定滑动窗口在输入数据张量在每一维上的步长。
- padding:一个字符串,取值为SAME或者VALID
- data_format:'NHWC’代表输入张量维度的顺序,N为个数,H为高度,W为宽度,C为通道数(RGB三通道或者灰度单通道)
- name(可选):为这个操作取一个名字。
import tensorflow as tf import numpy as np input_data = tf.Variable(np.random.rand(10,6,6,3),dtype=tf.float32) filter_data = tf.Variable(np.random.rand(2,2,3,10), dtype=np.float32) y = tf.nn.conv2d(input_data, filter_data, strides = [1,1,1,1], padding='SAME') output = tf.nn.avg_pool(y, ksize = [1,2,2,1], strides = [1,1,1,1], padding='SAME') tf.shape(output)
结果如下:
(2)计算池化区域中元素的最大值
tf.nn.max_pool(value, ksize, strides, padding, data_format=‘NHWC’, name=None)
input_data = tf.Variable(np.random.rand(10,6,6,3),dtype=np.float32) filter_data = tf.Variable(np.random.rand(2,2,3,10),dtype=np.float32) y = tf.nn.conv2d(input_data,filter_data,strides=[1,1,1,1],padding='SAME') output = tf.nn.max_pool(y, ksize=[1,2,2,1], strides=[1,1,1,1], padding='SAME') tf.shape(output)
(3)计算池化区域中元素的最大值和该最大值所在的位置
tf.nn.max_pool_with_argmax(input, ksize, strides, padding, Targmax=None, name=None)
input_data = tf.Variable(np.random.rand(10,6,6,3), dtype = np.float32) filter_data = tf.Variable(np.random.rand(2,2,3,10), dtype = np.float32) y = tf.nn.conv2d(input_data, filter_data, strides=[1,1,1,1], padding='SAME') output,argmax = tf.nn.max_pool_with_argmax(input = y, ksize = [1,2,2,1], strides = [1,1,1,1], padding = 'SAME') print(tf.shape(output)) print(tf.shape(argmax))