回答(1)
Evian, CFA2020-08-11 17:53:02
同学你好,
重复使用数据可以造成data-mining bias,过度获取此数据的特征,是的研究结果不具有普适性,样本外数据可检验这个偏差,具体可以这样理解。
举例:你要预测万科这只股票的走势,于是你调用了2010-2018年的万科股票历史收盘价,多次研究后,回归出来一个方程,这个相当于一个结论。
现在你想监测一下这个方程是否可以较为准确的为你预测(站在2018年这个时间点思考)将来的业绩表现,于是你把2019年的历史数据带入这个方程,可以计算得到一个Y,计算的Y,此时你拿这个Y和真实的2019年的收益率对比一下,看看是否真的很接近,这个就是用样本2010-2018样本以外的2019年数据检测一下。
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片
