计算机视觉实战的深度学习实战二:图像预处理
图像预处理
- 图像显示与存储原理
- 图像增强的目标
- 点运算:基于直方图的对比度增强
- 形态学处理
- 空间与处理:卷积
- 卷积的应用(平滑、边缘检测、锐化等)
- 频率域处理:傅里叶变换,小波变换
- 应用案例:平滑、边缘检测、CLAHE等
一、颜色空间
1、RGB颜色空间
- 加法混色(越叠加越白:255,255,255=白色),彩色显示
- 3个通道 (后面提到一张图片有三个维度,长,宽和通道(r,g,b))
- Red通道
- Green通道
- Blue通道
- 一个像素颜色值
- (b,g,r)
- 取值范围
- [0, 255]
- [0.0, 1.0]
2、CMYK颜色空间
- 减法混色,多用于印刷
- 4通道
- Cyan通道
- Magenta通道
- Yellow通道
- Key通道
- 一个像素颜色值
- (c,y,m,k)
- 取值范围
- [0, 255]
- [0.0, 1.0]
3、HSV颜色空间
- 人类视觉概念,画家配色
- 3各要素
- H/Hue:色调,颜色种类
- S/Saturation:饱和度,颜色的纯度
- V/Value:明度,颜色明亮度
- 一个像素颜色值
- (h,s,v)
- 取值范围
- [0, 255]
- [0.0, 1.0]
4、CIE-XYZ颜色空间
- 国际照明协会,1931
- 基于人类颜色视觉的直接测定
- 其他颜色空间基础
- 人类视觉系统-视锥细胞
- 短波(S,420-440nm)
- 中波(M,530-540nm)
- 长波(L,560-580nm)
- 3色刺激值通道
- X,Y,Z约略对应于红色,绿色,蓝色
- 一种波的刺激等于几种波的混合刺激
二、图片存储原理
1、主流颜色空间
SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。三、图像增强的目标
- 改善图像的视觉效果
- 转换为更适合人或机器分析处理的形式
- 突出对人或机器分析有意义的信息
- 抑制无用信息,提高图像的使用价值
- 具体包括图像锐化,平滑,去噪,灰度调整(对比度增强)
四、图像处理的方法
1、特征提取方法
-
直方图Histogram
- 对图片数据/特征分布的一种统计
- 灰度、颜色
- 梯度/边缘、形状、纹理
- 局部特征点、视觉词汇
- 区间bin
- 具有一定的统计或物理意义
- 一种数据或特征的代表
- 需要预定义或基于数据进行学习
- 数值是一种统计量:概率、频数、
- 对数据空间bin进行量化
- 对图片数据/特征分布的一种统计
-
直方图均衡化
-
自适应直方图均衡
- 直方图均衡的经典算法对整幅图像的像素使用相同的变换,如果图像中包括明显亮的或者暗的区域,则经典算法有限
- 自适应直方图均衡(AHE)算法通过对局部区域进行直方图均衡,来解决上述问题;
- 移动模板在原始图片上按特定步长滑动
- 每次移动后,模板区域内做直方图均衡,映射后的结果赋值给模板区域内所有点
- 每个点会有多次赋值,最终的取值为这些赋值的均值。
-
CLAHE
-
形态学运算
- 开运算:先腐蚀在膨胀,可以去掉目标外的孤立点
- 闭运算:先膨胀再腐蚀,可以去掉目标内的孔
- 通常,当有噪声的图像用阈值二值化后,所得到的边界是很不平滑的,物体区域具有一些错判的孔洞,背景区域散布着一些小的噪声物体,连续的开和闭运算可以显著的改善这种情况
-
空间域处理及其变换
-
均值滤波
-
平滑中值滤波/卷积
-
平滑高斯滤波/卷积
-
梯度Prewitt滤波/卷积
-
梯度Laplacian滤波/卷积
-
其他滤波/锐化

更多精彩