吴恩达机器学习课程笔记 | 第4章

Justin2022-02-102025-08-29

本系列文章如果没有特殊说明，正文内容均解释的是文字上方的图片
机器学习 | Coursera
吴恩达机器学习系列课程_bilibili

4 多变量线性回归

在这里插入图片描述

在这里插入图片描述
上图是新的假定函数

在这里插入图片描述

在这里插入图片描述

这里假设只有两个特征值，特征$x_1$的取值范围是0-2000，特征$x_2$的取值范围是1-5，之后作出的代价函数的等高线图会是一个又高又瘦的椭圆，在进行梯度下降算法时，可能会反复震荡导致收敛太慢，如上图左侧
将特征$x_1$和$x_2$缩放，使这两个特征值的范围都在0-1，这样产生的代价函数的图像会变成向上图右侧一样的圆形，这样就会更快地收敛
一般会让特征值处于$[-1,1]$范围内，如果比较接近$\pm1$也可以直接计算，不需要进行特征缩放
如果特征值过小，如$[-0.0001,0.0001]$也需要进行缩放

在这里插入图片描述

如特征$x_1$的平均值为1000，范围为$(0,2000]$，则可以将$x_1$化为$x_1=\frac{size-1000}{2000}$（在这里的例子里$x_1$是房屋的面积）
公式为$x_1=\frac{x_1-μ_1}{s_1}$，$s_1$为特征$x_1$原来的范围大小（$max-min$），$μ_1$为特征$x_1$原来的平均值

在这里插入图片描述
上图左侧纵坐标为计算得出的代价函数的值，横坐标为进行梯度下降算法的次数，次数增加后，代价函数会越来越接近最小值，逐渐收敛

取学习率时，通常是每隔大约三倍取，如$0.001,0.003,0.01,0.03.0.1,0.3,1$

在这里插入图片描述

（最小二乘法）
$$θ=(X^TX)^{-1}X^Ty$$

在这里插入图片描述
上图是梯度下降算法和正规方程的优缺点