189****68902022-03-10 20:43:04
请问,这里说的在单元线性回归里,Multiple R = | rxy|,这个|rxy|老师说的自变量和因变量的相关系数,这是不是就是线性回归方程式里的b1,那个斜率?
回答(1)
最佳
Jessica2022-03-11 09:58:47
同学你好
不是的哈。
在线性回归方程中,如果确定了一个X,在a和b都是常数且已知的情况下,就可以预测Y。
斜率b,它仅仅表示的是在完全线性关系中,Y随X变化的一个敏感程度:即在这条回归直线上,自变量X变动一单位,因变量Y的变动值是b。
而相关系数r,衡量的是X与Y之间的线性相关程度,r=±1,表明二者是完全线性相关的;-1<r<1,表明二者之间存在线性关系,但具体这个线性关系是大是小,要看r的绝对值,越接近与1,相关性就越大;越接近于0,相关性就越小;r=0,则表明二者之间没有线性关系。
~为乘风破浪的你【点赞】让我们知晓您对答疑服务的支持!~
- 评论(0)
- 追问(12)
- 追问
-
那是不是就是x和y的covariance?
- 追答
-
同学你好
不是的。斜率b1,表示的变量XY的相关系数等于+1或—1时,两个变量之间的变化的敏感度。跟协方差也是不一样的哈。
- 追问
-
那是不是就是x和y的correlation coefficient?因为correlation coefficient不就是表明2个变量之间线性关系这个关系的相关程度的数吗?
- 追答
-
同学你好
correlation coefficient,就是相关系数哦。如果是总体数据,那么x和y的相关系数的数学符号用ρ表示;如果是样本数据,那么x和y的相关系数的数学符号用r表示。
线性回归方程存在,其实是暗示了:x和y之间是完全线性关系的。那么,就有:
如果斜率b>0,对应的r(xy)=+1;如果斜率b<0,对应的r(xy)=—1
~为乘风破浪的你【点赞】让我们知晓您对答疑服务的支持!~
- 追问
-
那我第二个追问是不是对的。。。?老师给我个yes/no的回答把?我怎么感觉correlation coefficient就是multiple R?然后你最近的一次回答又像说是又像说不是XD
- 追答
-
同学你好
我明白你想确认的了,我来总结一下:
1)相关系数,correlation coefficient,如果是总体数据,那么x和y的相关系数的数学符号用ρxy表示;如果是样本数据,那么x和y的相关系数的数学符号用rxy表示。
2)Multiple R,它本身是正值:
如果样本数据 XY之间的相关系数 rxy 是正值的话,Multiple R = rxy
如果样本数据 XY之间的相关系数 rxy 是负值的话,Multiple R = - rxy
3)相关系数,和协方差,都是衡量XY之间的变化关系的。其中, rxy =+1或-1时,XY之间是线性相关,此时可以写成线性回程:Y = b0 + b1 X
~为乘风破浪的你【点赞】让我们知晓您对答疑服务的支持!~
- 追问
-
哪怕相关系数的绝对值不达到1也不能成为线性关系吗?比如|rxy|=0.98,这时候就不能写线性回程来描述x和y之间的关系?
- 追答
-
同学你好
即使不完全等于1,虽然可以用线性方程来描述,但是存在误差的。所以我们会在线性回归这一章有一个对整体模型的检验。通常,F的值越大,表明此时这个线性模型的拟合度是越好的,那么也就意味着此时的|rxy|是比较接近于1的。
为乘风破浪的你【点赞】让我们知晓您对答疑服务的支持!~
- 追问
-
好,那么correlation coefficient,就是测量线性关系的,Multiple R,就是绝对值后的额correlation coefficient?
斜率不用再重复了,我之后就想知道,那么covariance和correlation coefficient的差别是什么?
- 追答
-
同学你好
1)是的。可以这样理解。
2)correlation coefficient = covariance ÷(X的标准差 * Y 的标准差)
可以简单理解为:对 covariance进行剔除单位,就可以得到correlation coefficient
- 追问
-
那covariance在性质上的含义是啥?就是它测量了什么?
- 追答
-
同学你好
这个在基础班老师第一次介绍协方差的时候有讲过哦:
协方差,度量的是两个随机变量之间的相对变化关系,也就是两个随机变量变动的方向性。如果两个随机变量 为同向变化,即某一个随机变量的数值高于均值时另一个随机变量也高于均值,我们可称从平均来看两个随机变量相对于均值的变化方向是相同的,对应的此时协方差是大于0的;同理,协方差小于0,表明二者之间的变化方向是相反的。
那既然协方差已经可以表示两个变量之间的相对关系了,为啥还需要有相关系数?
这其实就是回到了我上次说的:对 covariance进行剔除单位,就可以得到correlation coefficient。
因为,协方差在描述X和Y之间的相关程度时,对同一物理量纲之下有一定的作用,但同样的两个量采用不同的量纲就会使它们的协方差在数值上表现出很大的差异。这里,不同的物理量纲,可以简单理解为数据的单位。为了改进协方差的这种缺点,有了剔除量纲影响的想法,从而就引入了相关系数。
比如,我们假设,XY的数据单位都是米。那么相关系数=协方差/标准差之积,分子上的协方差的单位为平方米,分母上两个随机变量的标准差的乘积的单位也是平方米,所以分 子分母单位上下约掉,最终相关系数是一个不带单位的比值的概念。这样,就剔除了不同单位下所产生的影响。
为乘风破浪的你【点赞】👍让我们知晓您对答疑服务的支持!~


评论
0/1000
追答
0/1000
+上传图片