回答(1)
黄石2025-04-22 10:12:41
同学你好。哑变量是一种取值非0即1的变量,用以反映某个变量的不同属性。比如说我们在建模季节性问题的时候,会采用季节性哑变量。例如数据展现出了月度的季节性规律,那么我们可以有12个哑变量,来去反映不同的月份。此时我们可以定义D1为一月份的哑变量,取值为1意味着是一月,取值为0意味着不是一月;D2为二月份的哑变量,取值为1意味着是二月,取值为0意味着不是二月;以此类推。
在使用哑变量建模季节性的时候,切记当模型中存在截距项时,我们不能将所有哑变量一并放入模型,否则会引发完全共线性(perfect collinearity),这通常被称作哑变量陷阱(dummy variable trap)。以月度哑变量为例,如果我们将十二个月的哑变量都放进去的话,那么D1 + D2 + ... + D12 = 1,即模型自变量之间存在着完全的线性关系。此时,模型系数无法被估计。对于这一问题,我们的做法是漏掉一个哑变量(我们也可以省掉截距项,没有截距项的情况下可以把所有哑变量都放入到模型中,这个简单了解一下就可以,一般不会考到这么深)。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片