赵同学2023-01-04 13:53:39
data snooping bias老师讲的时候说有个题眼叫“repeatedly searching",重复研究为什么不算是sample selection bias?
回答(1)
最佳
Evian, CFA2023-01-05 09:48:25
ヾ(◍°∇°◍)ノ゙你好同学,
Data snooping bias是模型分析数据时出现了过度拟合或者抓取样本信息,这个问题和“样本选择”没有直接关系(任意样本喂给模型都有可能发生dta snooping bias)。
Self-selection bias,样本选择偏差。
它指的是基金经理在对外报告自己业绩的时候,可以自我选择披露的对象,比如只披露自己手中经营的明星产品,业绩一般的就不对外进行公开。这种由自我选择所产生的偏差,被称为自我选择偏差。比如对冲基金的业绩披露就是如此。
data snooping bias(又称Data mining bias)
指的是数据挖掘偏差,是模型过度抓取了样本数据的特征,而不能将模型推广,以便准确估计总体特征。
例如,要研究哺乳动物。用猫的图片作为样本,总体是哺乳动物。
模型抓取信息过度的意思是,模型从猫的图片中总结“耳朵在头上方、爬行、全身有毛发,四肢差不多长”来估计总体,可是我们给电脑模型一张人类的图片,模型会说人不是哺乳动物。
这个过程没有人为主动影响结果的好坏,发生偏差的主要原因是模型分析数据程度的设置,或者样本容量较小。
----------------------
学而时习之,不亦说乎👍【点赞】鼓励自己更加优秀,您的声音是我们前进的源动力,祝您生活与学习愉快!~
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片

