许同学2018-10-29 19:58:35
老师 请问36题为何选B?谢谢
回答(1)
Cindy2018-10-30 16:00:24
同学你好,请问你做的是什么题目呀,我找了相关资料,都没有找到对应的说法……可以麻烦你把答案解析拍给我看看吗
- 评论(0)
- 追问(2)
- 追问
-
我做的是notes里的第二套模拟题 解析如图 谢谢
- 追答
-
同学你好,感谢你的提问,这个地方的知识点我确实没有关注过,有点偏,我去查了一下原版书,
首先对于time span ,关于数据质量的进一步描述是数据所指的时间跨度(time span)。理想情况下,数据集应该通过考虑整个信贷周期来生成;否则,估计将取决于特定的有利或不利的周期阶段。宏观经济状况是决定违约率的最重要因素之一。如果我们没有很好地描述信贷周期我们就错过了描述违约概率的相关内容。但是这个不是受我们控制的,宏观环境在变,所以time span不行
接下来就是sample size和size homogenity,还有lending techonology,样本大小和样本一致性都很重要:理想情况下,一个样本必须从一个独特的群体中生成,使用相同的过程、标准和方法。换句话说,样本必须由相同的“lending techonology”生成。lending techonology是用于信贷发放和监测的一组信息、规则、合同和政策;更改其中一个或多个组件会改变数据集中的信用组合生成和借款人的概况,并可能损害模型开发数据集与模型操作应用的一致性。但是lending techonology也不是我们人为可以控制的,lending techonology很难维持一成不变的,剩下的就是样本的大小和一致性了,这两个比起来样本的大小更好控制,样本的一致性定性的因素较多,控制起来更加不容易,不过这个也是可控制的,这道题问的是最可控的,所以还是选最容易控制的样本大小吧


评论
0/1000
追答
0/1000
+上传图片