MN2021-04-18 23:21:21
定量分析经典题167页386:B选项,没有截距项的时候就需要12个哑变量嘛,但是12中也是确定其中11个剩下的1个就自然确定啊,但是如果只用11个又没有截距项去表示剩下那个月的数值,所以不太知道没有截距项的时候应该怎么表示
回答(1)
Jenny2021-04-19 17:21:20
同学你好,没有截距项的时候,理论上可以引入12个哑变量,但是一般不会这么做。解释这个问题,要回到虚拟变量陷阱这个问题上。
一般在引入虚拟变量时要求如果有m个定性变量,在模型中引入m-1个虚拟变量。对于季度来说,一年有四个季度,假如D1表示第一季度,D2表示第二季度,D3表示第三季度,那么D4 就等于1-D1-D2-D3。这和它们的取值是0或1 是不矛盾的,现实是不可能出现既是第三季度,又是第二季度。比如现在是第二季度,D2=1,其他的变量就是都是0,包括D4. 假设D4也包含在模型里,那么变量之间就存在完全共线性。
另外,这里再对虚拟变量陷阱进行展开一下,这部分的解释会有些超纲,会涉及到矩阵和线性代数方面的内容,所以这部分会简单略过不展开。大概了解一下就可以了。
主要是记结论,即如果有截距项的情况下,只能引入m-1个虚拟变量,否则会导致虚拟变量陷阱。
假设y是因变量,自变量有C1、C2、C3。在有截距项b时,回归模型为:
y=a1×C1+a2×C2+a3×C3+b
按上图中的虚拟变量设置,用OLS(ordinary least squares)求解方程的时候,模型解为
[a1,a2,a3,b]’=invert((X’X))X’Y,
当有截距项b的并用时候,用上述公式求解模型就会遇到“虚拟变量陷阱”,也就是矩阵X’X是不可逆的(因为矩阵并不是满秩的)。简单来说就是完全多重共线性(即其中一个自变量可以完全由另外两个自变量决定)导致OLS算法中矩阵不可逆。从而无法计算回归模型的系数(“虚拟变量陷阱”是和回归模型的求解算法有关的,上述的OLS的闭式解会报错)。如果去掉截距项,这个矩阵是满秩的,也就是各列向量并不是线性相关。故此时,没有共线性的问题,那么就可以计算出回归模型的系数。
如果不含截距项的话,即使包含m个变量,也不会导致无法计算出系数,所以理论上可以有m个,但是一般不会这么做,考试基本上也不会考的。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片