SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。





机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables)

同样是预测房价问题  如果有多个特征值

机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 人工智能 第1张



机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 人工智能 第2张


那么这种情况下  假设h表示为 机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 人工智能 第3张

公式可以简化为机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 人工智能 第4张

 两个矩阵相乘   其实就是所有参数和变量相乘再相加  所以矩阵的乘法才会是那样

 那么他的代价函数就是机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 人工智能 第5张



机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 人工智能 第6张


机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 人工智能 第7张比如这种     那么X是[1,2,3]   y也是[1,2,3]   那么令theta0 = 0  theta1 = 1   这个函数返回值为0最小      theta0 = 0 theta1=0的话  返回值是2.333



要考虑是否需要特征缩放,特征缩放就是特征分配不均时   会导致梯度下降耗费更多  为了让梯度下降更快

所以机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 人工智能 第8张




梯度下降算法的每次迭代受到学习率的影响,如果学习率 过小,则达到收敛所需的迭代次数会非常高,如果学习率过大,每次迭代可能不会减小代价函数,可能会越过局部最小值导致无法收敛。




机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 人工智能 第9张




梯度下降  线性回归的python代码


# -*- coding=utf8 -*-

import math;

def sum_of_gradient(x, y, thetas):
m = len(x);
grad0 = 1.0 / m * sum([(thetas[0] + thetas[1] * x[i] - y[i]) for i in range(m)])
grad1 = 1.0 / m * sum([(thetas[0] + thetas[1] * x[i] - y[i]) * x[i] for i in range(m)])
return [grad0, grad1];

def step(thetas, direction, step_size):
"""move step_size in the direction from thetas"""
return [thetas_i + step_size * direction_i
for thetas_i, direction_i in zip(thetas, direction)]

def distance(v, w):
return math.sqrt(squared_distance(v, w))

def squared_distance(v, w):
vector_subtract = [v_i - w_i for v_i, w_i in zip(v, w)]
return sum(vector_subtract_i * vector_subtract_i for vector_subtract_i, vector_subtract_i
in zip(vector_subtract, vector_subtract))

def gradient_descent(stepSize, x, y, tolerance=0.000000001, max_iter=100000):
iter = 0
# initial theta
thetas = [0, 0];
# Iterate Loop
while True:
gradient = sum_of_gradient(x, y, thetas);

next_thetas = step(thetas, gradient, stepSize);

if distance(next_thetas, thetas) < tolerance: # stop if we're converging
thetas = next_thetas # continue if we're not

iter += 1 # update iter

if iter == max_iter:
print 'Max iteractions exceeded!'

return thetas

x = [1, 2, 3];
y = [5, 9, 13];
stepSize = 0.001;
t0, t1 = gradient_descent(-stepSize, x, y);
print t0, " ", t1;



线性回归还有一种更简单的  就是正规方程

这个是用数学推导出来的机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 人工智能 第10张


 两者对比: 机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 人工智能 第11张


机器学习(三)--------多变量线性回归(Linear Regression with Multiple Variables) 人工智能 第12张


拒绝背锅 运筹帷幄