线型模型理论基础

线性模型理论基础

1.一般线型回归

1.1 相性回归与最小二乘法
1.2 线型模型正则化

1.2.1 岭回归
1.2.2 Lasso 回归
1.2.3 ElasticNet回归

2.逻辑回归（对数几率回归）
3.线性判别分析

3.1二分类线性判别

Reference

1.一般线型回归

1.1 相性回归与最小二乘法

线型模型理论基础

在一些情况下，如样本矩阵X的列数多于行数，此时X^TX是不满秩的，对应的能够解出多个W，此时可以引入正则化项选择最优的W。

损失函数最小化可以使用梯度下降法求解，在使用该方法时，一定要将特征值归一化。这一点是极为重要的，归一化的好处在于（1）提升了模型的收敛速度，减少求得最优解的时间。（2）提升模型的精度，这一点在涉及到距离计算的算法时效果十分明显。

1.2 线型模型正则化

正则化的目的是降低模型的复杂度，常见的几种线性模型正则化有岭回归、Lasso回归和ElasticNet回归，
线型模型理论基础
其中，α是正则化系数，它控制正则化项的占比，这个值很关键。α的初始值建议设置为0，在确定了learning rate后再进一步确定α的值。首先粗调节（如每次增大或减少10倍）将预测准确率控制在一个较满意的水平后再进行α值的细调节（假设粗调节α确定在0.01到0.1之间，细调节则0.01, 0.02……如此细微调节）至预测最佳。目前，训练过程中使用梯度递减的学习率是一个很常见的方法。