data snooping bias老师讲的时候说有个题眼叫“repeatedly searching"，重复研究为什么不算是sample selection bias？



你还未登录〜

天堂之歌

听歌而来，送我踏青云〜

0元

充值
0橙宝

充值

首页
版块大全

财经学院

CFA FRM CFRM 量化投资

从业资格

证券从业银行从业

会计学院

CPA 会计职称 ACCA CMA 财会求职灌水闲聊

金程考研

公共课 199管综 396经综金融学硕金融专硕经济学硕士会计硕士考研院校考研就业

投资理财

RFP

金融杂谈

金融动态金融八卦吐槽专区

求职招聘

职业发展金融求职职场经验职场修养

研招信息

专业院校热点资讯考研交流考研经验

考研科目

专业课公共课 199管理类联考 396经济类联考

生活日常

运动音乐电影美食交友租房

个人发展
论坛

您现在的坐在位置：首页>智汇问答>CFA一级

赵同学2023-01-04 13:53:39

data snooping bias老师讲的时候说有个题眼叫“repeatedly searching"，重复研究为什么不算是sample selection bias？

回答（1）

最佳

Evian, CFA2023-01-05 09:48:25

ヾ(◍°∇°◍)ﾉﾞ你好同学，

Data snooping bias是模型分析数据时出现了过度拟合或者抓取样本信息，这个问题和“样本选择”没有直接关系（任意样本喂给模型都有可能发生dta snooping bias）。

Self-selection bias，样本选择偏差。
它指的是基金经理在对外报告自己业绩的时候，可以自我选择披露的对象，比如只披露自己手中经营的明星产品，业绩一般的就不对外进行公开。这种由自我选择所产生的偏差，被称为自我选择偏差。比如对冲基金的业绩披露就是如此。

data snooping bias（又称Data mining bias）
指的是数据挖掘偏差，是模型过度抓取了样本数据的特征，而不能将模型推广，以便准确估计总体特征。

例如，要研究哺乳动物。用猫的图片作为样本，总体是哺乳动物。
模型抓取信息过度的意思是，模型从猫的图片中总结“耳朵在头上方、爬行、全身有毛发，四肢差不多长”来估计总体，可是我们给电脑模型一张人类的图片，模型会说人不是哺乳动物。
这个过程没有人为主动影响结果的好坏，发生偏差的主要原因是模型分析数据程度的设置，或者样本容量较小。
----------------------
学而时习之，不亦说乎👍【点赞】鼓励自己更加优秀，您的声音是我们前进的源动力，祝您生活与学习愉快!~