卷积神经网络

发展卷积神经网络的额初衷是进行图像分类。图像主要有如下3个特性:

  • 多层次结构: 如边缘组成眼睛,眼睛和鼻子等组成脸,脸和身体等组成人。
  • 特征局部性: 如眼睛就局限在一个小区域,提取眼睛特征时,只需根据这个小区域的像素提取即可。
  • 平移不变性: 如不管眼睛在图像哪个位置,特征提取器都需提取眼睛特征。根据图像的这3个特性,卷积神经网络引入特有的先验知识知识——深度网络、局部连接和参数共享。

局部连接

在常规神经网络中,每个神经元都与前一层中的所有神经元连接(全连接),但是神经元连接方式在图像分类中既不现实也没有必要。因为,在全连接方式下,权重的数量可能达千万量级甚至亿级,大量的参数不仅会延长训练过程,还会导致网络产生过拟合,除此之外,存储大量权重还需要消耗大量内存。 根据特征局部性,如果某个神经元需要提取眼睛特征,则只需要针对眼睛所在的局部区域内的像素进行特征提取,不需要提取眼睛区域外的信息,所以该神经元只需与眼睛区域进行局部连接。

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

局部连接上面这一段写的不够准确,待改进。

参数共享

在图像分类中,同一个物体可能会在图像的不同位置出现,例如人脸会出现在图像的任意位置,神经元必须对人脸的位置不敏感。而识别不同位置人脸的不同神经元,采用的权重应该是相对的。因为神经元学习是先通过权重和像素进行内积,再进行非线性激活实现的。这些神经元共享相同的参数,这就是参数共享。

还缺少平移不变性,待改进。

卷积神经元的组织方式

  要提取图像的特征,必须有大量的神经元,它们从观察输入的同一局部区域提取不同特征。这些神经元的组织方式必然是三维:高度、宽度和深度。高度和宽度决定神经元的空间尺寸,深度决定了对输入区域提取特征的维度(每个神经元)提取一个特征。例如,将车牌图像作为输入,

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄