134****45182023-12-07 18:25:49
这道题出自FRM一级中文精度补充版P35-36,题目是关于评估模型的。这里有三个问题需要解答。1、题目并没有规定阳性代表什么,为什么这里直接判断阳性就代表了违约,如何做出这个判断的?2、题目要求评估模型差异,请说明一下计算出来的四个指标是越大越好还是约越小越好,截图划线的部分是怎么判断出来的(或者这几个指标怎么组合可以判断模型好坏)?3、按照老师讲课的课件,可以通过画图判断ROC曲线下的面积来判断模型的好坏,如果放到这个题目中,应该怎么做(需要计算步骤和画图结果)?谢谢。
回答(1)
黄石2023-12-08 09:24:20
同学你好。
问题1:一般业内默认选择少数派作为阳性,因为阳性一词过去多用在疾病检测上,绝大多数情况下都是少数人染病呈阳性,多数人阴性。当然,实际研究中只要定义正确,其实对阳性的设置并没有那么重要,最终研究出来的结果都是一样的。
问题2:Accuracy、Precision和Recall都是越高越好。但是需要注意的是,Accuracy在样本不均衡的情况下并不是一个很好的衡量指标,例如肿瘤科医生看病,不经检验就告诉每个患者他们没有患病,此时虽然检查的准确率较高,但没有任何意义,因为癌症的患病率本来就较低。这时我们应更多地关注Precision和Recall。其中,精确率在假阳性(一类错误)的成本较高时非常有益。举例说明,如果某种制造成本非常高昂的产品本身质量过关,但质检认为其质量不合格,那么此时假阳性的成本较高,需要模型做到足够的精确。召回率则在假阴性(二类错误)的成本较高时非常有益。举例说明,如果某种产品本身质量不过关,但质检认为其质量合格,致使产品最终被寄送至重要客户,那么此时假阴性的成本较高(失去重要客户与口碑受损),需要模型的召回率足够的高。
问题3:对于ROC的刻画同学可以看如下案例https://www.statology.org/roc-curve-excel/
- 评论(0)
- 追问(2)
- 追问
-
样本是否均衡是怎么判断的呢?
- 追答
-
同学你好。样本不均衡的情况指的是阳性和阴性人群占比不平衡。例如癌症的患病率,阳性(患癌)的人在人群中是少数,绝大部分人是阴性(不患癌)。
评论
0/1000
追答
0/1000
+上传图片

