153****01882023-04-25 16:15:42
1.有outliers是好的还是坏的?2.outlier和y和其他x有什么关系3.我们是希望在regression中除去异常值outlier的吗?
回答(1)
Michael2023-04-25 17:05:21
学员你好,从模型建模的角度来说是一个需要去解决的问题,给数据处理增加了难度。
outliers的存在会使得模型的估计出现不准,照顾了异常值就忽略了正常值,忽略了异常值就会让模型有解释的缺陷。
我们希望合理去除异常值,比如说在比赛中会去掉一个最大值一个最小值,但是不能只去掉最大值。
- 评论(0)
- 追问(2)
- 追问
-
1.outliers和x和y有什么关系呢?有多重共线性吗?2.需要去除outliers吗?怎么去除outliers呢?请老师分别1,2回答哈
- 追答
-
1.utlier指的是x和y之间出现异常关系的数据点,异常值可以是x也可以是y。比如研究身高和体重的关系的时候,我们发现大部分的数据都满足身高越高体重越大,但是有一个数据则正好相反(比如身高220cm,体重40kg),这种就是异常值可能是身高220cm,也可能是40kg。
2.是不是去掉outlier需要结合实际情况。如果统计者认为这个数据点对分析的意义不大(比如我想研究身高在150-180cm的人的身高和体重的关系),那么就可以去掉这个数据点(身高220cm,体重40kg),然后使用其他的数据去研究分析即可;但是如果研究者认为这个数据对研究有意义,则不可以删除。
评论
0/1000
追答
0/1000
+上传图片
