天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA二级

圆同学2020-06-22 18:21:05

单老师讲义171页所说的normalization与standardization,对异常值敏感不敏感,是个什么意思??弄不明白呀。 另外机器学习与大数据的内容,听起来很痛苦,有没有什么中文版公开课可以辅助学习一下呢??

回答(1)

Kevin2020-06-23 10:22:13

同学你好!

1.Normalization和Standardization的过程如图。

举个简单的例子,分类的问题,x=-1000,-10,-5,-4,-3,-2,-1,0,1,2,3,4,5,10,1000,其中-1000和1000都是异常值。训练出来的模型,会判定x在-3到3之间y为1,其余为0,也就是x=-3,-2,-1,0,1,2,3时,y=1。

而Normalization后,这个区间也会相应压缩,可能会变成x(normalized)在-0.3到+0.3之间y(new)为1,其余为0,但此时由于异常值的存在,分母特别大,原本不在-3到3的数据点,经过Normalization后,都在-0.3到0.3之间,即x=-10,-5,-4,-3,-2,-1,0,1,2,3,4,5,10时,y=1。因此该算法对异常值敏感。

而Standardization经过该变化,直观上理解,就是区间并没有压缩,因为是根据该组数据的均值和标准差调整的,保留了该组数据的性质。

因此Standardization对异常值不太敏感。

2.中文的课程可以到网易云,慕课这些公开课上去搜索机器学习、深度学习等内容,一般这些课程涉及内容更广,深度更深。

  • 评论(0
  • 追问(0
评论

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2025金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录