-2023-04-22 23:24:24
老师,请讲解百题case 10的Q4,听了视频讲解没懂,(1)有劳再详细每个选项逐一讲解哈;(2)另外,这一题对应的考点是强影响点(极值),选项a既然不属于高杠杆点也不是强影响点,为什么不对呢?谢谢。
回答(1)
最佳
爱吃草莓的葡萄2023-04-23 11:35:58
同学你好。题目问的是为什么极值点不是问题,说明极值点不影响回归线才不是个问题。只有B选项符合意思,极值点接近回归线并没有将回归线倾斜,所以不是个问题,因此C选项不对。
此外outlier、high leverage point都是影响回归线的,明显就是干扰项,与题目意思不对。
同学如果回答解决了您的疑惑,请给回答给予采纳。祝早日持证!
- 评论(0)
- 追问(2)
- 追问
-
谢谢Alvis老师。我总结一下:
Extreme data不成问题是在于它不属于强影响点,满足一下两个条件(/或之一):
(1)close to the regression line
(2)but not tilt the regression line
反之,只要极值点具有以下其中一点属性,就成问题:
(1)not close to regression line
(2)tilt the regression line
(3)an outlier
(4)a higher leverage point(hii > 3(k+1/n))
(5)Studentized residual > 3,甚至 > critical value
(6)Cook’s distance > 2√(k/n)。
是以上这样理解吗?谢谢。
- 追答
-
同学你好。你的总结很好,给你点赞。
不给可以给你一点小提示,题目中说的极值点你理解的时候应该打上引号,因为这个极值点是否真的是极值点呢。是真的极值点,那么举个极端例子,它会离直线远远的,也就是你下面列出的六条。如果离直线紧密靠近,那可能就是个假极值点,它对直线构不成威胁(即改变不了直线斜率)。
而题目说了“该极值点”不是问题,可以简单理解为不是极值点,就是正常点,围绕在直线附近,对直线构不成威胁(即不改变直线斜率)。
评论
0/1000
追答
0/1000
+上传图片

