回归:输出为数值
- 股票市场预测
=>
道琼斯指数 - 自动驾驶汽车
=>
方向盘角度 - 推荐系统
=>
购买可能性
线性回归
模型
损失函数
最优化
- 梯度下降
针对参数$w$,考虑损失函数 $L(w) $- 1.随机选择初始值$w^0$
- 2.计算$\frac{\mathrm{d} L}{\mathrm{d} w}|_{w=w^0}$
- 3.更新$w_1\leftarrow w_0-\eta \frac{\mathrm{d} L}{\mathrm{d} w}|_{w=w^0}$
- 存在问题:
过拟合问题
- 这5个模型都是线性模型(是否线性模型看w的次数)
- 更复杂的模型具有更小的训练误差
- 更复杂的模型不一定具有更小的泛化误差(发生过拟合)
正则化
- $ L(w,b) = \sum_{n}(\hat{y}^n-(b+\sum w_ix_i))^2 + \lambda \sum(w_i)^2$
- 更小的$w_i$值代表模型更平滑(考虑下面方程,当$x$变化$\delta x$时,$y$变化为$\sum w_i \delta x_i$,当$w$越小时,$y$变化越小)