平方和与拟合优度¶
1 平方和¶
1.1 总平方和¶
-
名称:总离差平方和\总平方和 TSS (Total Sum of Squares)
-
公式:
-
含义:反应了观测真实值和真实平均值之间的偏差情况,这里没有使用误差而是因为和都是真实值,一个是观测到的,一个是真实值计算出来的
1.2 回归平方和¶
-
名称:回归平方和、或者解释平方和 ESS(Explained Sum of Squares)
-
公式:
1.3 残差平方和¶
-
名称:残差平方和、或者剩余平方和
-
公式:
1.4 关系¶
-
公式:
-
解释:如果我们使用观测到的真实值,通过线性回归模型对它们进行拟合计算,那么观测到的真实值与真实平均值之间的偏差会表现在模型的两个方面,第一个方面是模型估计值与真实平均值之间的偏差,另一个方面是观测真实值与模型估计值之间的偏差,而且正好是这两个方面的总和。
-
推导:
-
首先对进行展开
-
由于有
- 由此可以推出定理:一定有
-
因此有
2 拟合优度(可决系数和相关系数)¶
-
定义:
-
回归方程对观测值拟合的怎么样,就叫做拟合优度,R-square,就是度量拟合优度的一个统计量,即常说的r方,它叫做可决系数
-
相关系数:
-
公式:
-
意义
- 线性回归(右侧)比均值(左侧)拟合数据越好,则越接近1
-
蓝色区域面积代表相对于线性回归的平方残差,红色区域代表相对于平均值的平方残差。
-
拟合优度还有另一个测定指标是相关系数,相关系数的公式
-
公式
-
可以看出可决系数只是相关系数的平方
-
它们存在的目的是为了提供互相补充的信息,它俩最著要的区别在于:相关系数有正负,正意味着因变量随自变量递增,拟合直线从左到右上升,反之意味着递减,从左到右下降
-
最后,其实有