圆同学2022-07-03 19:11:39
这个哑变量的问题, N个分类,设置N个变量,不是正好吗?设置n-1个是何意义??就题目中说第四季度的销量作为B0,但是每一年的第4季度销量又不相同呀,b0还需要根据每一年的数据再更改一下???是何来头,真是不理解。
回答(1)
Essie2022-07-04 15:14:37
你好,n个类别中,只需要设置n-1个哑变量,就可以用回归方程将n个类别都表达出来。
拿季度举例,在4个季度中如果多设一个Q4哑变量,Q1=1时,Q2=Q3=Q4=0,代表第一季度。那么Q1+Q2+Q3+Q4总是会等于1的,所以任意一个季度都可以被其他季度的线性组合表示出来,因此就存在了多重共线性,违反了多元回归的前提假设。
如果只有3个哑变量,截距是Q4的均值,它是拿来做回归的数据中全部Q4销量的均值,也不需要每年第四季度的数据相同,模型建立好后也不需要修改截距。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片