卷积神经网络
卷积神经网络
发展卷积神经网络的额初衷是进行图像分类。图像主要有如下3个特性:
- 多层次结构: 如边缘组成眼睛,眼睛和鼻子等组成脸,脸和身体等组成人。
- 特征局部性: 如眼睛就局限在一个小区域,提取眼睛特征时,只需根据这个小区域的像素提取即可。
- 平移不变性: 如不管眼睛在图像哪个位置,特征提取器都需提取眼睛特征。根据图像的这3个特性,卷积神经网络引入特有的先验知识知识——深度网络、局部连接和参数共享。
局部连接
在常规神经网络中,每个神经元都与前一层中的所有神经元连接(全连接),但是神经元连接方式在图像分类中既不现实也没有必要。因为,在全连接方式下,权重的数量可能达千万量级甚至亿级,大量的参数不仅会延长训练过程,还会导致网络产生过拟合,除此之外,存储大量权重还需要消耗大量内存。 根据特征局部性,如果某个神经元需要提取眼睛特征,则只需要针对眼睛所在的局部区域内的像素进行特征提取,不需要提取眼睛区域外的信息,所以该神经元只需与眼睛区域进行局部连接。
SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。局部连接上面这一段写的不够准确,待改进。
参数共享
在图像分类中,同一个物体可能会在图像的不同位置出现,例如人脸会出现在图像的任意位置,神经元必须对人脸的位置不敏感。而识别不同位置人脸的不同神经元,采用的权重应该是相对的。因为神经元学习是先通过权重和像素进行内积,再进行非线性激活实现的。这些神经元共享相同的参数,这就是参数共享。
还缺少平移不变性,待改进。
卷积神经元的组织方式
要提取图像的特征,必须有大量的神经元,它们从观察输入的同一局部区域提取不同特征。这些神经元的组织方式必然是三维:高度、宽度和深度。高度和宽度决定神经元的空间尺寸,深度决定了对输入区域提取特征的维度(每个神经元)提取一个特征。例如,将车牌图像作为输入,

更多精彩