undefinable2022-11-16 22:53:34
请讲下data mining 和misinterpretation
回答(1)
最佳
Johnny2022-11-17 15:37:08
同学你好。
Data mining是反复地搜索数据集,直至出现显著的模式。这些数据本不存在相关性或者特定范式,但由于你不停的抽样或者搜索数据,就会偶然间突然出现一些数据会存在特定模式。这就是data mining bias,他并不存在经济原理也不符合逻辑,仅仅是由于过度搜索数据集从而偶然间出现了数据上的显著模式。
Misinterpretation of correlation就比如A和B之间存在高度相关,那么就有四种可能,要么A能预测B,要么B能预测A,要么有第三个变量C能同时预测A和B,要么A和B之间的高度相关仅仅是异常值而已。要是解释错了其中的高相关性就是misinterpretation,就比如A和B本身没有经济联系,只是抽样抽到了异常值结果导致数值上存在相关度,但你却说能用A去预测B。
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片



