别同学2022-05-22 18:12:18
请问课后题reading5第29到31题怎样理解呢?
回答(1)
Essie2022-05-23 09:43:08
你好,
Q29:本题问p value设置为哪个阈值,会使模型拟合达到最佳。根据exhibit 2,AUC越高,说明模型性能越好。因为阈值p值为0.79,训练数据集上的AUC为91.3%,交叉验证集为89.7%,另外,模型的ROC曲线在这两个数据集上的表现非常相似,因此说明p=0.79是拟合效果最佳的模型。
Q30:在阈值p值为0.84时,训练集的AUC为98.4%,交叉验证集的AUC为87.1%,这表明当前模型存在过拟合问题(训练集的模型的拟合程度明显高于交叉验证集)。这时候就可以利用LASSO正则化,它应用于逻辑回归,以防止模型的过度拟合。
Q31:当模型对训练集中数据的预测误差较小,而交叉验证集中对数据的预测误差较大,这种情况叫做轻微正则化slight regularization。出现这种情况的同时会伴随较高的方差误差,所以B说low variance是错的。而且通常是由于太多的特征和模型的复杂性,导致模型出现过拟合问题,所以A说underfitted也是错的。
- 评论(0)
- 追问(0)


评论
0/1000
追答
0/1000
+上传图片