天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA一级

赵同学2023-01-04 13:53:39

data snooping bias老师讲的时候说有个题眼叫“repeatedly searching",重复研究为什么不算是sample selection bias?

回答(1)

最佳

Evian, CFA2023-01-05 09:48:25

ヾ(◍°∇°◍)ノ゙你好同学,

Data snooping bias是模型分析数据时出现了过度拟合或者抓取样本信息,这个问题和“样本选择”没有直接关系(任意样本喂给模型都有可能发生dta snooping bias)。

Self-selection bias,样本选择偏差。
它指的是基金经理在对外报告自己业绩的时候,可以自我选择披露的对象,比如只披露自己手中经营的明星产品,业绩一般的就不对外进行公开。这种由自我选择所产生的偏差,被称为自我选择偏差。比如对冲基金的业绩披露就是如此。

data snooping bias(又称Data mining bias)
指的是数据挖掘偏差,是模型过度抓取了样本数据的特征,而不能将模型推广,以便准确估计总体特征。

例如,要研究哺乳动物。用猫的图片作为样本,总体是哺乳动物。
模型抓取信息过度的意思是,模型从猫的图片中总结“耳朵在头上方、爬行、全身有毛发,四肢差不多长”来估计总体,可是我们给电脑模型一张人类的图片,模型会说人不是哺乳动物。
这个过程没有人为主动影响结果的好坏,发生偏差的主要原因是模型分析数据程度的设置,或者样本容量较小。
----------------------
学而时习之,不亦说乎👍【点赞】鼓励自己更加优秀,您的声音是我们前进的源动力,祝您生活与学习愉快!~

  • 评论(0
  • 追问(0
评论

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2026金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录