sunny2023-04-24 23:56:33
老师好,请问set a higher than normal t-value or smaller p-value本身不就是data mining的解决方法吗?为什么这题说分析师这么做会存在data mining呢?
回答(1)
最佳
Essie2023-04-25 15:54:25
同学你好,设置很低的显著性水平,让假设检验更难拒绝原假设,这才是解决data mining的方法。但是需要注意的是,本题它说的不是解决data mining的方法。
题干说这个分析师,在很多次实验中,只挑了t统计量最大的值,和p value最小的值,也就是说都是挑了些显著的结果。
只挑选显著的结果,放弃不显著的结果,这就是出现了data mining的问题。
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片
