卷积神经网络通俗理解

卷积神经网络通俗理解如下:

卷积神经网络(CNN)-结构

①CNN结构一般包含这几个层:

输入层:用于数据的输入

卷积层:使用卷积核进行特征提取和特征映射

激励层:由于卷积也是一种线性运算,因此需要增加非线性映射

池化层:进行下采样,对特征图稀疏处理,减少数据运算量。

全连接层:通常在CNN的尾部进行重新拟合,减少特征信息的损失

输出层:用于输出结果

②中间还可以使用一些其他的功能层:

归一化层(BatchNormalization):在CNN中对特征的归一化

切分层:对某些(图片)数据的进行分区域的单独学习

融合层:对独立进行特征学习的分支进行融合

请点击输入图片描述

卷积神经网络(CNN)-输入层

①CNN的输入层的输入格式保留了图片本身的结构。

②对于黑白的28×28的图片,CNN的输入是一个28×28的二维神经元。

③对于RGB格式的28×28图片,CNN的输入则是一个3×28×28的三维神经元(RGB中的每一个颜色通道都有一个28×28的矩阵)

2)卷积神经网络(CNN)-卷积层

感受视野

①在卷积层中有几个重要的概念:

localreceptivefields(感受视野)

sharedweights(***享权值)

②假设输入的是一个28×28的的二维神经元,我们定义5×5的一个localreceptivefields(感受视野),即隐藏层的神经元与输入层的5×5个神经元相连,这个5*5的区域就称之为LocalReceptiveFields,