Python大数据分析与应用实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.4.1 线性回归的基本概念

可以将一元线性回归理解为,给定自变量x,其和因变量y之间的关系建模。可以将一元线性回归方程定义为

其中,y为因变量,x为自变量,a为回归系数(回归直线的斜率),b为常数项(回归直线在Y轴上的截距)。

一元线性回归可以理解为,通过已知的样本点找到最佳拟合直线的过程。最佳地拟合已知数据可以采用最小二乘等方法,这里不展开介绍,具体的细节读者可以自行查阅相关资料。线性回归示意图如图2-18所示。

多元线性回归与一元线性回归类似,只是多元线性回归需要添加预测变量的数量及其相应的系数:

多元线性回归的过程可以被理解为通过已知样本点,求β0,β1,βp等参数的过程。

图2-18 线性回归示意图