圆同学2022-07-08 12:55:11
关于Standardization说的异常值并不敏感,20万的值代进去,检验统计量也是非常大的呀,怎么就不敏感了?一下子就辨别出来了嘛……咋就不敏感了?希望再仔细说说。
回答(1)
最佳
Essie2022-07-08 17:59:04
你好,Standardization的计算公式为Xi(standardized)=(Xi-μ)/σ,可以看出其值是取决于数据的均值和标准差的,通常做机器学习的数据集是非常庞大的,其中一个数据对整体均值和方差的影响相对比较有限,所以说它对异常值不那么敏感。
- 评论(0)
- 追问(2)
- 追问
-
那为什么百分比的形式就敏感了呢??能否举例比较加以说明,本知识点我也个迷瞪蛋
- 追答
-
另外一种易受异常值影响的方法是归一化,计算是通过(Xi-Xmin)/(Xmax-Xmin),如果样本中存在异常值,那么就会直接影响Xmax或Xmin,最终导致归一化的结果不同,所以这个方法易受异常值的影响。


评论
0/1000
追答
0/1000
+上传图片