1.线性可分

对于一个数据集:

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第1张

如果存在一个超平面X能够将D中的正负样本精确地划分到S的两侧,超平面如下:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第2张

那么数据集D就是线性可分的,否则,不可分。

 w称为法向量,决定了超平面的方向;b为位移量,决定了超平面与原点的距离。

样本空间中的任意点x到超平面X的距离(不太熟悉的可以复习高数中空间几何那一章的内容)可以写为:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第3张

使得下面两式成立的训练样本支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第4张称为支持向量:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第5张

两个异类支持向量(一个等于+1,一个等于-1)到超平面的距离之和为:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第6张

它称之为“间隔”

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第7张

 想找到最大间隔的划分超平面,就是使支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第8张最大:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第9张

等价于:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第10张

这就是支持向量机的基本模型。

对偶问题:

上式的拉格朗日函数可写为:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第11张

其中,支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第12张

对参数w和b求导可得:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第13张

将上式带入到拉格朗日函数中,消去w和b,得到对偶表达式:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第14张

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第15张

采用SMO算法完成对偶问题的求解:

原始论文地址:http://www-ai.cs.uni-dortmund.de/LEHRE/SEMINARE/SS09/AKTARBEITENDESDM/FOLIEN/Joerg_Nitschke_Sequential_minimal_optimization.pdf

核函数:

对于非线性可分的训练样本通过核函数将原始空间映射到更高维的特征空间来使得样本线性可分。

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第16张表示x映射后的特征向量,那么新的模型可以表示为:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第17张

可以得出:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第18张

对偶问题表示为:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第19张

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第20张

这里涉及到支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第21张,这是样本支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第22张支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第23张映射到高维特征空间后的內积,我们不直接计算支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第24张,设计一个函数:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第25张

重写为:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第26张

求解出支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第27张,即可求出模型:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第28张

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第29张

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第30张

我会在优化理论里面更仔细地分析核函数。

软间隔和正则化:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第31张

软间隔允许某些样本不满足支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第32张约束,优化目标可以改写为:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第33张

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第34张是非凸、非连续的函数,采用其他函数来代替支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第35张,称为surrogate loss。通常surrogate loss是凸的连续函数且是支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第36张的上界。下面有三种常用的代理损失函数:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第37张

若采用hinge损失:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第38张

引入松弛变量支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第39张

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第40张

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第41张

得到拉格朗日函数:

 支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第42张

其中支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第43张是拉格朗日乘子。

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第44张

对偶问题:

支持向量机(SVM)算法分析——周志华的西瓜书学习 人工智能 第45张

 

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄