LeNet-5 神经网络结构详解

卷积层的参数计算：

卷积后feature map边长： outputSize =（originalSize + paddingX2 – kernelSize）/ stride + 1 （其中outputSize是卷积之后得到的feature map的边长，originalSize是输⼊图的边长，padding是填充的⼤⼩，kernelSize是卷积核的边长，stride是步长）
卷积层的可训练的参数个数： trainNum = (outputSize X outputSize + 1) X kernelNum (其中kernelNum是卷积核的个数，加1是因为每⼀个卷积核有⼀个bias参数)
卷积层的连接数： connectNum = (kernelSize X kernelSize) X (outputSize X outputSize) X kernelNum
卷积层的神经元个数： neuralNum = (outputSzie X outputSize) X kernelNum

采样层的参数计算：

采样后map的边长： outputSize =（originalSize + paddingX2 – kernelSize）/ stride + 1 （其中outputSize是卷积之后得到的feature map的边长，originalSize是输⼊图的边长，padding是填充的⼤⼩，kernelSize是卷积核的边长，stride是步长）
采样层可训练的参数个数： trainNum = (1+ 1) X kernelNum (其中kernelNum是卷积核的个数)
采样层的连接数： connectNum = (kernelSize X kernelSize) X (outputSize X outputSize) X kernelNum
采样层的神经元个数： neuralNum = (outputSzie X outputSize) X kernelNum

LeNet-5共包含7层（不包括输入层）

1）C1层是一个卷积层，由6个特征图Feature Map构成。特征图中每个神经元与输入为5×5的邻域相连。特征图的大小为28×28，这样能防止输入的连接掉到边界之外（32-5+1=28）。C1有156个可训练参数（每个滤波器55=25个unit参数和一个bias参数，一共6个滤波器，共(55+1)6=156个参数），共156(28×28)=122,304个连接

2）S2层是一个子采样层，有6个14×14的特征图。特征图中的每个单元与C1中相对应特征图的2×2邻域相连接。S2层每个单元的4个输入相加，乘以一个可训练参数，再加上一个可训练偏置。每个单元的2×2感受野并不重叠，因此S2中每个特征图的大小是C1中特征图大小的1/4（行和列各1/2）。S2层有12（6（1+1）=12）个可训练参数和5880（14×14（2×2+1）6=5880）个连接。

3）C3层也是一个卷积层，它同样通过5×5的卷积核去卷积层S2，然后得到的特征map就只有10×10个神经元，但是它有16种不同的卷积核，所以就存在16个特征map了。 C3中每个特征图由S2中所有6个或者几个特征map组合而成。

为什么不把S2中的每个特征图连接到每个C3的特征图呢？原因有2点：

第一，不完全的连接机制将连接的数量保持在合理的范围内
第二，也是最重要的，其破坏了网络的对称性

由于不同的特征图有不同的输入，所以迫使他们抽取不同的特征（希望是互补的）。例如，存在的一个方式是：C3的前6个特征图以S2中3个相邻的特征图子集为输入。接下来6个特征图以S2中4个相邻特征图子集为输入。然后的3个以不相邻的4个特征图子集为输入。最后一个将S2中所有特征图为输入。这样C3层有1516（6（3×25+1）+6（4×25+1）+3（4×25+1）+（25×6+1）=1516）个可训练参数和151600（10×10×1516=151600）个连接。

4）S4层是一个子采样层，由16个5×5大小的特征图构成。特征图中的每个单元与C3中相应特征图的2×2邻域相连接，跟C1和S2之间的连接一样。S4层有32个可训练参数（每个特征图1个因子和一个偏置16*（1+1）=32）和2000（16*（2×2+1）5×5=2000）个连接

5）C5层是一个卷积层，有120个特征图。每个单元与S4层的全部16个单元的5×5邻域相连。由于S4层特征图的大小也为5×5（同滤波器一样），故C5特征图的大小为11（5-5+1=1）：这构成了S4和C5之间的全连接。之所以仍将C5标示为卷积层而非全相联层，是因为如果LeNet-5的输入变大，而其他的保持不变，那么此时特征图的维数就会比11大。C5层有48120（120（16×5×5+1）=48120由于与全部16个单元相连，故只加一个偏置）个可训练连接。

6）F6层有84个单元（之所以选这个数字的原因来自于输出层的设计），与C5层全相连。有10164（84*(120*(1*1)+1)=10164）个可训练参数。如同经典神经网络，F6层计算输入向量和权重向量之间的点积，再加上一个偏置。然后将其传递给sigmoid函数产生单元i的一个状态。

7）最后，输出层由欧式径向基函数（Euclidean Radial Basis Function）单元组成，每类一个单元，每个有84个输入。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

成功，源于对美学的执著追求

LeNet-5 神经网络结构详解

发表回复取消回复

成功，源于对美学的执著追求

发表回复 取消回复

发表回复取消回复