回答(1)
Evian, CFA2022-06-05 12:39:57
ヾ(◍°∇°◍)ノ゙你好同学,
look ahead bias发生的原因是投资者使用了市场上不存在的数据。
举例:
我们来研究一家公司的年报信息,具体的年份是21年,那么年报中的信息应该是从21年1月1日~12月31日,即使次年(要求不晚于3月31日)公司才会向公众公布财报信息,公布的财报信息不可以包含22年1月1日~3月31日的数据。
总结:我们研究21年财报使用了22年的数据,此时产生了前瞻性偏差。
Data mining bias指的是数据挖掘偏差,是模型过度抓取了样本数据的特征,而不能准确估计总体特征。
例如,研究哺乳动物。
用猫的图片作为样本,总体是哺乳动物,模型抓取信息过度的意思是,模型从猫的图片中总结“耳朵在头上方、爬行、全身有毛发,四肢差不多长”来估计总体,可是我们给电脑模型一张人类的图片,模型会说人不是哺乳动物。
这个过程没有人为主动影响结果好坏,主要原因是模型的设置,或者样本容量较小。
样本选择偏差指的是样本不能代表总体,例如现在要估计一下2010-2018年的整体中国股票市场的业绩表现,选择的样本一定是市场上存活的股票,而挂掉的股票是不会抽样到的,这个时候会高估真实市场总体(有活着的也有挂掉)的股票业绩。
---------------------
学而时习之,不亦说乎👍【点赞】鼓励自己更加优秀,您的声音是我们前进的源动力,祝您生活与学习愉快!~
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片
