雨同学2022-03-25 00:50:47
为什么哑变量是n-1?
回答(1)
Jessica2022-03-25 10:54:09
同学你好
因为当所有的自变量都取0的时候,截距项可以代表剩余的那个类。
我们用季节因素举例分析:
比如我们假设认为服装的销量和季节是有关系的,因此在构造服装销量与季节的回归模型中引入了三个哑变量,X1 ,X2,X3这三个哑变量,他们的取值范围都是0或1,分别代表了第一季度、第二季度、第三季度,“1”表示当季的意思,“0”表示非当季。此时回归方程写作:Y=b0+b1*X1+b2*X2+b3*X3+εi
如果要计算第一季度的服装销售量,那么可以令X1=1,其它自变量X2,X3都等于0即可。
b0+b1表示了第一季度的销量,b0+b2表示第二季度的销量,b0+b3表示第三季度的销量,当X1 ,X2,X3都为0时,b0就表示第四季度的销量。因为服装的总销售量是可以被唯一确定的,当前三季度的销量都为0时,销量只会发生在第四季度。
因此,在研究问题的时候把所有的问题分成了N类,那么模型就至少需要N-1个哑变量。
为乘风破浪的你【点赞】让我们知晓您对答疑服务的支持!~
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片

