回答(1)
Evian, CFA2022-08-22 14:11:21
ヾ(◍°∇°◍)ノ゙你好同学,
B 数据挖掘偏差
例如,我们找了21年上半年,将上半年的数据作为Test Dataset测试集,用模型回归,得出结论X(例如单元回归Y和X成线性关系)
out of sample test指的是我们又找了21年下半年的数据,作为Validation Datasets验证集,用来验证结论X是否可以解释21年下半年的数据。如果结论X不能解释21年下半年的数据,说明结论X过度抓取了Test Datasets的特征,不可以很好的推广至其他时间段,单元回归Y和X成线性关系不成立
C存活性偏差,无法用out of sample test验出来,因为无论哪一个时期,拿到的样本都是市场存活下来的好资产。
----------------------
学而时习之,不亦说乎👍【点赞】鼓励自己更加优秀,您的声音是我们前进的源动力,祝您生活与学习愉快!~
- 评论(0)
- 追问(2)
- 追问
-
B选项没有听懂
- 追答
-
Data mining bias指的是数据挖掘偏差,是模型过度抓取了样本数据的特征,而不能准确估计总体特征。
例如,研究哺乳动物。
用猫的图片作为样本,总体是哺乳动物,模型抓取信息过度的意思是,模型从猫的图片中总结“耳朵在头上方、爬行、全身有毛发,四肢差不多长”来估计总体,可是我们给电脑模型一张人类的图片,模型会说人不是哺乳动物。
这个过程没有人为主动影响结果好坏,主要原因是模型的设置,或者样本容量较小。
评论
0/1000
追答
0/1000
+上传图片
