Silvia2021-03-10 11:13:43
老师,重大遗漏变量如果和其他变量无关系,为什么是模型的错误,这个错误和多重贡献性剔除的逻辑能再讲讲吗
回答(1)
Jenny2021-03-10 15:03:26
同学你好,对于一个回归模型,最理想的情况莫过于:
模型包含了可以解释因变量的所有自变量,同时剔除了所有不能解释因变量的自变量。但是,基本上所有的模型都无法达到这个条件,他们之中,要么(1)剔除了应该包含的自变量,要么,(2)包含了不该包含的自变量。如果是剔除了应该包含的变量, 这种现象称之为遗漏变量,这个才是模型风险呀,而不是和其他变量无关才叫做模型风险。遗漏变量之所以会造成最小二乘法产生偏差是因为被解释变量中原本应该由遗漏变量所解释的部分并没有得到充分的解释,而是被其他的解释变量所解释了,这样就会造成其他解释变量的斜率( 回归) 系数产生误差,从而造成了对于不同的解释变量Xi,模型的误差也不尽相同,这违反了多元线性回归模型中所有的自变量Xi 都不能与残差项存在相关性,即Cov(Xi ,εi)的前提假设。
多重共线性在模型里还是比较常见的,一般来说对于模型不会造成太大问题,只有存在完全共线性的时候才需要剔除部分变量,因为不剔除的话,无法得出模型参数(这个是算法层面的问题,简单知道结论即可)。
- 评论(0)
- 追问(3)
- 追问
-
多重贡献性高F低T,那既然所有变量一起显著,每一个单独的自变量剔除后都不显著,所以做模型的人才要一个个剔除,再重新做回归,这样就可能有重大遗漏变量了吗
- 追问
-
还有就是违反自变量不能和残差有关系,但是剔除重大遗漏变量后,这个解释的部分就会被其他自变量解释,那造成的误差就是其他自变量的系数误差,为什么还会违反残差和被剔除的自变量的不相关性呀
- 追答
-
1. 在做回归模型的时候,本身也是要在遗漏变量和多重共线性之间做取舍的呀。多重共线性本来就是普遍存在的,所以,加入遗漏的相关的变量,可能会出现多重共线性,但一般不会线性相关(完全线性相关)。如果多重共线性太严重,可能就可以考虑换个指标。反过来,如果线性模型对于现实数据解释力度已经足够好,那么某一程度也是可以忽略遗漏变量的。
考试只要知道二者概念是什么就可以啦。
2. 不是误差项和被剔除的变量之间的相关性,而是误差和模型中还剩下的xi之间的相关性,你可以理解为被剔除的变量部分跑到了误差项里去,而被剔除的部分又和模型里剩下的变量相关,所以误差和模型里剩下的变量也就相关了。


评论
0/1000
追答
0/1000
+上传图片