回答(1)
 Irene2020-09-24 11:15:07
Irene2020-09-24 11:15:07
                        同学你好
不是的哦。这里问的是,以下哪一类偏差可以用样本外数据监测?就是说:用了样本外数据,可以反馈出这类偏差。
这个问题主要出现在data-mining bias里面,就是说因为反复使用同一组数据库建模和测试,会导致对样本内数据模拟得非常好,但是因为建模时过度关注样本内数据的偶然因素,如果换一组样本外数据,这些偶然因素就不存在了,会导致样本外数据估计不准确。所以这个就是data mining bias的定义:把偶然当必然。这个bias可以用样本外数据监测,只要发现:用样本外数据测试模型,模型估计的准确度会大幅降低,这个就知道是data mining bias。
A说的是look-ahead bias是说用还未公开的数据建模,和样本外数据无关。
C说的是样本选择偏差,就是说人为剔除一些取不到的数据。
这两个问题,都不能用样本外数据直接监测出来。所以不选。
- 评论(0)
- 追问(0)
 
     
        评论
0/1000
追答
0/1000
+上传图片
 
                
             
                     
                 Paddy
Paddy
 Irene
Irene