圆同学2020-06-22 18:21:05
单老师讲义171页所说的normalization与standardization,对异常值敏感不敏感,是个什么意思??弄不明白呀。 另外机器学习与大数据的内容,听起来很痛苦,有没有什么中文版公开课可以辅助学习一下呢??
回答(1)
Kevin2020-06-23 10:22:13
同学你好!
1.Normalization和Standardization的过程如图。
举个简单的例子,分类的问题,x=-1000,-10,-5,-4,-3,-2,-1,0,1,2,3,4,5,10,1000,其中-1000和1000都是异常值。训练出来的模型,会判定x在-3到3之间y为1,其余为0,也就是x=-3,-2,-1,0,1,2,3时,y=1。
而Normalization后,这个区间也会相应压缩,可能会变成x(normalized)在-0.3到+0.3之间y(new)为1,其余为0,但此时由于异常值的存在,分母特别大,原本不在-3到3的数据点,经过Normalization后,都在-0.3到0.3之间,即x=-10,-5,-4,-3,-2,-1,0,1,2,3,4,5,10时,y=1。因此该算法对异常值敏感。
而Standardization经过该变化,直观上理解,就是区间并没有压缩,因为是根据该组数据的均值和标准差调整的,保留了该组数据的性质。
因此Standardization对异常值不太敏感。
2.中文的课程可以到网易云,慕课这些公开课上去搜索机器学习、深度学习等内容,一般这些课程涉及内容更广,深度更深。
- 评论(0)
- 追问(0)
评论
0/1000
追答
0/1000
+上传图片

