李同学2020-08-07 21:58:52
为什么ESS的自由度为k,RSS的自由度为n-k-1?异常值的检测,用cook's distance,分子的含义是什么?
回答(1)
Jenny2020-08-10 11:11:31
同学你好,对于RSS来说,因为k+1个回归系数可以仅由k+1个 y与x的关系式 联立方程求得,所以占用k+1个自由度(更准确的说是带来k+1个自由度限制)。剩下的残差自由度就是n-k-1。换句话说,当知道了k+1个最小二乘回归系数,n个y中知道了任意n-k-1个y,剩下的k+1个y可以计算出来。而ESS为回归平方和,即拟合值与均值之差的平方和,那么知道拟合值需要知道k+1个系数就ok了,但是均值占用了一个自由度,所有能够自由取值的变量个数就只有k个。
cook´s distance 用于诊断各种回归分析中是否存在异常数据。如果某一条数据记录被排除在外,那么由此造成的回归系数变化有多大。显然,如果这个值过大,那么就表明这条数据对回归系数的计算产生了明显的影响,这条数据就是异常数据,需要好好考量是否在你的模型中使用这条数据。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片