填充(Padding)是指在输入的两侧填充元素(通常用 0 填充),通常情况下,填充的个数为偶数,是为了保证在原始数据上进行对称填充,尽量不破坏原始数据结构
步长是指卷积窗口在输入数据上依次滑动的长度大小。步长可以减小输出的长度,为了保证输入数据的完整性,大部分情况下步长设置为 1
通道(Channel)是指输入数据的最后一个维度,即每个卷积层中卷积核的数
量。以图像领域为例,图像的通道通常是指灰度值,如 RGB 代表着 3 个通道。一个通道是对某个特征的检测,通道中某一处数值的强弱就是对当前特征强弱的反映。因此,通道数的设置通常是为了挖掘序列中的特征
神经网络中的卷积操作由于多个神经元共用卷积核引起的权值共享特性,导致网络中连接数和参数数量下降,但是卷积后得到的特征映射组中的神经元个数并不会显著减少。卷积层直接连接分类器依然可能导致过拟合的出现,计算复杂度过高也会影响网络的训练效率。为此,卷积神经网络中通常会在卷积层后加入池化层来达到降低特征映射维数,避免过拟合,提高网络效率的作用
池化层(Pooling Layer)也叫子采样层(Subsampling Layer),卷积神经网络
中使用池化层来进行特征选择,降低特征数量,同时缓解卷积层对位置的过度敏
感性,提高所提取特征的鲁棒性。池化(Pooling) 是指对每个区域进行下采样(Down Sampling)得到一个值,作为这个区域的概括
最大池化(Maximum Pooling):指对某个区域范围内所有的神经元取其
最大值作为代表该区域的特征值;平均池化(Mean Pooling):指对某个区域范围内所有的神经元取其平均值作为代表该区域的特征值
在卷积神经网络中,使用最广泛的典型池化层是将每个特征映射划分为长度
为 2 的不重叠区域,然后使用最大池化的方式进行下采样。此外,池化层也可以看做是一个特殊的卷积层,卷积核大小为 m,步长为 s,卷积核为 max 函数或 mean函数。过大的采样区域会急剧减少神经元的数量,会造成过多的信息损失