张同学2022-03-05 19:23:18
老师,我不太懂哑变量怎么就是完美的多重共线性了(图片最上一行)
回答(1)
Jenny2022-03-07 13:34:07
同学你好,这里不是完美共线性,只是多重共线性的统计特征。
高F说明解释变量整体是具有显著解释效力的,但是对于单个变量做假设检验(t检验)时,单个变量又都没有解释力度,而这种矛盾点就是来自于多重共线性,由于多重共线性的存在,变量之间相互关联,导致变量系数估计量的标准误增大(估计难度增大),所以t统计量的分母增大,那么相应的t统计量算出来就比较小,会误导做出参数为0的判断,所以t是不显著的。
感谢正在寒冬中乘风破浪的您来提问~如果您对回复满意可【点赞】鼓励您和Jenny更加优秀,您的声音是我们前进的动力,祝您生活与学习愉快!~
- 评论(0)
- 追问(4)
- 追问
-
不不不,我问的是373题目上面那个d选项
- 追答
-
上课的时候,我们应该讲过这个说法:如果回归模型中含有截距项,若一个定型变量有m个类别,则引入m-1个虚拟变量。如果回归模型不含截距项,则m种特征可以引入m个虚拟变量。
如果既包含m个虚拟变量,这些变量之间存在完全线性关系(因为加起来等于1),又有截距项就会产生虚拟变量陷阱。
这部分的解释会有些超纲,会涉及到矩阵和线性代数方面的内容,所以这部分会简单略过不展开。大概了解一下就可以了。
主要是记结论,即如果有截距项的情况下,只能引入m-1个虚拟变量,否则会导致虚拟变量陷阱。
假设y是因变量,自变量有C1、C2、C3。在有截距项b时,回归模型为:
y=a1×C1+a2×C2+a3×C3+b
按上图中的虚拟变量设置,用OLS(ordinary least squares)求解方程的时候,模型解为
[a1,a2,a3,b]’=invert((X’X))X’Y,
当有截距项b的并用时候,用上述公式求解模型就会遇到“虚拟变量陷阱”,也就是矩阵X’X是不可逆的(因为矩阵并不是满秩的)。简单来说就是完全多重共线性(即其中一个自变量可以完全由另外两个自变量决定)导致OLS算法中矩阵不可逆。从而无法计算回归模型的系数(“虚拟变量陷阱”是和回归模型的求解算法有关的,上述的OLS的闭式解会报错)。如果去掉截距项,这个矩阵是满秩的,也就是各列向量并不是线性相关。故此时,没有共线性的问题,那么就可以计算出回归模型的系数。
理论上,去掉截距的话,就可以引入m个虚拟变量,但是在建立模型的时候,通常是建立含截距项的模型。虽然不含截距项的模型引进和类别相同数量的虚拟变量不存在完全共线性的问题,但要检验截距项的差值会更加困难,且不含截距项的回归在计算r方上没有一个一致的方法。所以一般都是采用含有截距项的模型进行研究。
感谢正在寒冬中乘风破浪的您来提问~如果您对回复满意可【点赞】鼓励您和Jenny更加优秀,您的声音是我们前进的动力,祝您生活与学习愉快!~
- 追问
-
这次懂一些了 谢谢老师
- 追答
-
不客气,还有疑问的话,欢迎随时提问~


评论
0/1000
追答
0/1000
+上传图片