王同学2019-12-29 18:25:03
练习册50页的32题,答案给的是应该用dummy variable. 但是晨星评级这个指标明明是有大小关系的变量,用普通变量标记1-5不是更好吗?dummy variable应该只在男女这类没有大小关系的变量吧
回答(1)
Johnny2019-12-29 22:34:11
同学你好,此处是要加入一个有关评级的自变量,这个变量是1-5中选一个的,正确的做法是用四个哑变量,某个哑变量为1,其他的都为0。比如说评级为1的那个X1=1,其他的为0,那就代表这是当评级等于1的时候。如果评级为2的那个X2为1,其他哑变量都为0,那就代表这是当评级为2的时候,就这样以此类推下去。那么当所有四个哑变量X1、X2、X3、X4都为0时,这就代表评级为5的时候。总之如果有n个分类的话就需要用n-1个哑变量,如果直接使用n个哑变量的话那么会产生完全共线性。
- 评论(1)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片


