潇同学2022-01-11 19:12:14
是不是可以这么理解,问题实质问的是out-of-sample-test,样本外检验,这个测试方法能测出以下哪个BIAS?然后这个检验方法就是现有样本得出的结论或者模型在其他时间段的样本等情况下能否复现或者复用,否则就是存在BIAS,对么?这个test是不是也可以验证幸存者偏差?
查看试题回答(1)
Jessica2022-01-12 11:48:49
同学你好
out-of-sample test,指的是样本外检验,指的是另取一组样本数据(时间段与之前的样本采集不同),对基于原来的样本数据所获得的结论进行检验,看是否能产生同样的检测结果。
而选项B:数据挖掘偏差,指的是由于反复使用同一组数据进行建模和检测而产生的误差,也就是说对相同或者相关数据的过度研究使用所造成的。
因此, 通过使用与已经开发过模型的样本所处的时间段不重叠的样本进行检验,可以判断是否存在数据挖掘偏差。故这个题目选B。
比如,你要预测万科这只股票的走势,于是你调用了2010-2018年的万科股票历史收盘价,回归出来一个方程,现在你想检测一下这个方程是否可以较为准确的为你预测(站在2018年这个时间点思考)将来的业绩表现,于是你把2019年的历史数据带入这个方程,可以计算得到一个Y,计算的Y,此时你拿这个Y和真实的2019年的收益率对比一下,看看是否真的很接近。其中这个用2010-2018样本以外的2019年数据来检测,就是样本外检验。
另外,这个方法,只能用于检测数据挖掘偏差,不能检测其他偏差的。
为乘风破浪的你【点赞】👍让我们知晓您对答疑服务的支持!~
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片
