孙同学2021-02-18 12:14:05
老师好,对于回归检验有两个问题: 1、这个图片中的M-fold方法每听懂操作步骤,如果有n个数据,是将其分为m(3)组吗?然后是将其中两组怎么样和第三组比较吗?还有为什么是AB两组一组数据做横坐标,一组数据做纵坐标呢?不是一组数据就包括对应的(x,y)吗?没懂,麻烦老师再解释一下M-fold方法 2、诊断说如果X包括一些无用变量,即x太多,那么bias小,为什么estimation error会变大呢?什么是estimation error?
回答(1)
Jenny2021-02-18 17:36:50
同学你好,
1. 对于每一个模型,M 折交叉验法都会经历如下的步骤:
首先初始采样分割成M 个子样本,一个单独的子样本被保留作为验证模型的数据,其他M-1 个样本用来训练计算模型的参数。
每一次验证结束之后,都会对模型进行评价,并计算残差平方和。在交叉验证重复M 次后,由于每个子样本作为验证集都验证了一次,我们便可获得
M 次模型的总残差平方和。
对于一个模型的M 折交叉验法就结束了,接下去就是对剩下的2k -1 个不同自变量组合的模型逐一进行M 折交叉验法,每一个过程都会进行M 次交叉
验证并计算总残差平方和。
最终,总残差平方和最小的模型会被选定为最优模型。
2. 如果变量太多,那么模型就可能会过于复杂,在对系数进行估计的时候产生误差的可能是就会变大,也就是estimation error。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片