136****33312026-04-05 20:27:38
不太理解为什么引入更多的自变量X以后,ESS会不断上升,TSS不会改变,从而让拟合程度更高,为什么ESS会上升,麻烦讲解的更详细一些
回答(1)
黄石2026-04-07 13:59:32
同学你好。首先,TSS是Y的实际值y与Y的平均值之间差值的平方和,这一统计量并不会受到引入新的X的影响(引不引入这些X都不影响到Y的实际值和平均值)。对于ESS,这是模型可以解释的变动的部分。新引入的X只要不是完全与Y无关的,否则都会使ESS上升,因为这个X是在原先已有的X的基础上引入的——原先已有的X确保了模型的ESS在引入新的X之后不会下降,而如果新的X对Y有一定的解释力度的话,那么ESS就会上升。举个好懂的例子,就像你正在做FRM的考试题,已经做了90道(这相当于原先的模型),接下来你做完最后10道题(这相当于引入了新的X的模型)。只要你后续做的10道题不是全错,那么你做这100道题的正确题数肯定是高于90道题中的正确题数的(对应引入新X的模型的ESS肯定≥原模型的ESS)。
- 评论(0)
- 追问(2)
- 追问
-
老师,您举的例子我完全理解加入变量X让ESS的上升了,但是为什么TSS不变?你说的TSS是Y的实际值y与Y的平均值之间差值的平方和,这一统计量并不会受到引入新的X的影响(引不引入这些X都不影响到Y的实际值和平均值)这个是为什么,引入了10道题,那Y的实际值和平均值为什么不受影响,新做了10道题不是会影响整个100道题目平均值吗?
- 追答
-
同学你好。在这个例子中,TSS就是100道题的总体数,不会受到你做了多少道题的影响。举一个更贴近计量经济学的例子,比方说我要预测一个人的收入(收入是Y),现在找到了100个个体,获得了100个收入的数据(y)。自变量我设置成年龄,对应有100个年龄的数据(x1)。现在我向模型中引入一个新的自变量,比方说就是学历,那么这100个个体我们还要获得100个学历的数据。但是,不论我引不引入学历的数据,这100个个体的收入的实际值和均值都不会受到影响。
评论
0/1000
追答
0/1000
+上传图片
136****3331
